Role
Description
Analysis variables
The variables that you assign to this role are 
the numeric variables for which you want 
statistics. You must assign at least one 
variable to this role.
Classification variables
The variables that you assign to this role are 
character or discrete numeric variables that 
are used to divide the input data into 
categories or subgroups. The statistics are 
calculated on all selected analysis variables 
for each unique combination of classification 
variables.
Additional Roles
Group analysis by
The variables that you assign to this role are 
used to compute separate statistics for each 
distinct value or combination of values of the 
Group analysis by variables. The data is 
automatically sorted by the variables in this 
role before the statistics are computed.
Frequency count
When you assign a variable to this role, each 
observation in the table is assumed to 
represent n observations, where n is the 
value of the frequency count for that row. 
Statistics are calculated accordingly. You can 
assign a maximum of one variable to this role.
Weight variable
If you assign a variable to this role, the value 
of the variable for each observation is used to 
calculate weighted means, variances, and 
sums. You can assign a maximum of one 
variable to this role.
Setting Options
Option Name
Description
Summary Statistics Task
187
Pdf email link - insert, remove PDF links in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Free C# example code is offered for users to edit PDF document hyperlink (url), like inserting and deleting
add hyperlink to pdf acrobat; pdf edit hyperlink
Pdf email link - VB.NET PDF url edit library: insert, remove PDF links in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Help to Insert a Hyperlink to Specified PDF Document Page
add hyperlinks to pdf; add link to pdf
Basic Statistics
Mean
is the arithmetic average, calculated by 
adding the values of an analysis variable and 
dividing this sum by the number of 
nonmissing observations.
Standard deviation
is a statistical measure of the variability of a 
group of data values. This measure, which is 
the most widely used measure of the 
dispersion of a frequency distribution, is equal 
to the positive square root of the variance.
Minimum value
is the smallest value for an analysis variable.
Maximum value
is the largest value for an analysis variable.
Median
is the middle value for an analysis variable.
Number of observations
is the total number of observations with 
nonmissing values.
Number of missing values
is the number of observations with missing 
values.
Additional Statistics
Standard error
is the standard deviation of the sample mean. 
The standard error is defined as the ratio of 
the sample standard deviation to the square 
root of the sample size.
Note: This option is available only if Degrees 
of freedom is selected in the Divisor for 
standard deviation and variance drop-down 
list.
Variance
is a statistical measure of dispersion of data 
values. This measure is an average of the 
total squared dispersion between each 
observation and the sample mean.
Mode
is the most frequent value for the analysis 
variable.
188
Chapter 10 0 / / Statistics Tasks
RasterEdge.com General FAQs for Products
copy and email the secure download link to the assistance, please contact us via email (support@rasteredge & profession imaging controls, PDF document, image to
add hyperlink pdf document; add links pdf document
RasterEdge Product Licensing Discount
s). After confirming the informations provided, we will send you an email that contains price(s) at a discount and the online order link for new licensing.
pdf hyperlink; adding links to pdf document
Range
is the difference between the largest and the 
smallest values in the data.
Sum
is the sum of all values in the analysis 
variable.
Sum of weights
is the sum of the numeric variable that is used 
to weight each observation.
Note: You cannot compute the sum of the 
weights unless you assign a variable to the 
Weight variable role.
Confidence limits for the mean
are the two-sided confidence limits for the 
mean. A two-sided 100
(
1−
α
)
% confidence 
interval for the mean has the following upper 
and lower limits:
x
¯
±
t
(
1−
α
2
;
n
−1
)
s
n
, where s is 
1
n
−1
Σ
(
xi
x
¯)
2
and 
t
(
1−
α
2
;
n
−1
)
is the 1−
α
2
of 
the Student’s t statistics with 
n
−1 degrees of 
freedom.
Coefficient of variation
is a unitless measure of relative variability. 
This measure is defined as the ratio of the 
standard deviation to the mean expressed as 
a percentage. The coefficient of variation is 
meaningful only if the variable is measured on 
a ratio scale.
Skewness
is skewness, which measures the tendency of 
the deviations to be larger in one direction 
than in the other.
Kurtosis
is the kurtosis, which measures the heaviness 
of tails.
Percentile Statistics
1st, 5th, 10th, Lower quartile, Median, 
Upper quartile, 90th, 95th, 99th, 
Interquartile range
choose the percentiles and quantiles to 
compute.
Summary Statistics Task
189
RasterEdge Product Renewal and Update
4. Order email. Our support team will send you the purchase link. HTML5 Viewer for .NET; XDoc.Windows Viewer for .NET; XDoc.Converter for .NET; XDoc.PDF for .NET;
adding a link to a pdf in preview; add url link to pdf
VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to
Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Create PDF file from PowerPoint free online without email.
chrome pdf from link; add link to pdf acrobat
Quantile method
specifies the method that is used to compute the 
quantiles, median, and percentiles.
Order statistics
reads all of the data into memory and sorts 
it by the unique values.
Piecewise-parabolic algorithm
approximates the quantile and is a less 
memory-intensive method.
Plots
Histogram
creates a graph that is used to determine the 
distribution of the data. If you add a normal 
density curve, the task uses the sample mean 
and sample standard deviation for 
μ
and 
σ
. If 
you add a kernel density curve, the task uses 
the AMISE method to compute the kernel 
density estimates.
To include the statistics in the graph, select 
the Add inset statistics check box.
Comparative box plot (when classification 
variable is specified)
creates a graph that shows a measure of 
central location (the median), two measures 
of dispersion (the range and interquartile 
range), the skewness (from the orientation of 
the median relative to the quartiles), and 
potential outliers. Box plots are especially 
useful in comparing two or more sets of data.
You can choose to add the overall inset 
statistics to the graph or only the inset 
statistics for each group.
Plot combines histogram and box plot 
(when no classification variable is 
specified)
displays the histogram and box plots together 
in a single panel, sharing common X axes.
Methods
190
Chapter 10 0 / / Statistics Tasks
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Free online Word to PDF converter without email.
add email link to pdf; add hyperlink to pdf in preview
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Convert Excel to PDF document free online without email.
change link in pdf; convert excel to pdf with hyperlinks
Divisor for standard deviation and 
variance
specifies the divisor to use in the calculation of the 
variance and standard deviation. Here are the valid 
options:
Degrees of freedom
n
−1
By default, the divisor for the variance is 
the degrees of freedom.
Number of observations
n
Sum of weights minus one
(
Σ
iwi
)
−1
Sum of weights
Σ
iwi
Output Data Set
You can specify whether to save the statistics in an output data set. By default, this data set is 
saved in the Work library.
Distribution Analysis Task
About the Distribution Analysis Task
Distribution analysis provides information about the distribution of numeric variables. A 
variety of plots such as histograms, probability plots, and quantile-quantile plots can be 
used in this analysis.
Example: Distribution Analysis of Sales for 
Each Region
In this example, you want to analyze the sales for each region. Because the data 
contains three regions, you get three sets of results.
Distribution Analysis Task
191
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
Create editable Word file online without email. Supports transfer from password protected PDF. VB.NET class source code for .NET framework.
add links to pdf in acrobat; adding a link to a pdf
C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
and .docx. Create editable Word file online without email. Password protected PDF file can be printed to Word for mail merge. C# source
add a link to a pdf; active links in pdf
To create this example:
1
In the Tasks section, expand the Statistics folder and double-click Distribution 
Analysis. The user interface for the Distribution Analysis task opens.
On the Data tab, select the SASHELP.PRICEDATA data set.
3
Assign columns to these roles:
Role
Column Name
Analysis variables
sale
Classification variables
regionName
4
Click the Options tab. In the Checking for Normality group, select the Goodness-
of-fit tests, Histogram with normal curve, and Normal quantile-quantile plot 
options. For the quantile-quantile plot, also select the Add a reference line check 
box.
5
To run the task, click 
.
192
Chapter 10 0 / / Statistics Tasks
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
Export PDF from Excel with cell border or no border. Free online Excel to PDF converter without email. Quick integrate online C# source code into .NET class.
adding hyperlinks to pdf; convert doc to pdf with hyperlinks
C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF
application. Free online PowerPoint to PDF converter without email. C# source code is provided for .NET WinForms class. Evaluation
add hyperlink pdf file; add url to pdf
Here is a subset of the results:
Distribution Analysis Task
193
Assigning Data to Roles
To run the Distribution Analysis task, you must assign a column to the Analysis 
variables and select a plot or test on the Options tab.
Role
Description
Roles
Analysis variables
specifies the analysis variables and their 
order in the results.
Classification variables
specifies the variables that are used to group 
the analysis variables into classification 
levels. You can assign only two columns to 
this role.
Additional Roles
194
Chapter 10 0 / / Statistics Tasks
Role
Description
Frequency count
specifies a numeric variable whose value 
represents the frequency of the observation. 
The Distribution Analysis task assumes that 
each observation represents n observations, 
where n is the value of the variable.
Group analysis by
specifies the variables that the Distribution 
Analysis task uses to form groups.
Setting Options
Option Name
Description
Exploring Data
Select the Histogram check box to create a histogram of the data. You can also specify 
whether to superimpose a kernel density estimate and the normal density curve on the 
histogram. Finally, you can specify whether to include an inset box of selected statistics in the 
graph.
Checking for Normality
Goodness-of-fit tests
requests tests for normality that include a 
series of goodness-of-fit tests based on the 
empirical distribution function. The table 
provides test statistics and p-values for the 
Shapiro-Wilk test (provided the sample size is 
less than or equal to 2,000), the Kolmogorov-
Smirnov test, the Anderson-Darling test, and 
the Cramér-von Mises test.
Histogram with normal curve
displays fitted normal density curve on the 
histogram. The normal distribution has a 
mean of 
μ
and a standard deviation of 
σ
.
You can also specify whether to include an 
inset box of selected statistics in the graph.
Distribution Analysis Task
195
Option Name
Description
Normal probability plot
creates a probability plot, which compares 
ordered variable values with the percentiles of 
the normal distribution. If the data distribution 
matches the normal distribution, the points on 
the plot form a linear pattern. Probability plots 
are preferable for graphical estimation of 
percentiles.
The distribution reference line on the plot is 
created from the maximum likelihood 
estimate for the parameter.
You can also specify whether to include an 
inset box of selected statistics in the graph.
Normal quantile-quantile plot
creates quantile-quantile plots (Q-Q plots) 
and compares ordered variable values with 
quantiles of the normal distribution. If the data 
distribution matches the normal distribution, 
the points on the plot form a linear pattern. Q-
Q plots are preferable for graphical estimation 
of distribution parameters.
The distribution reference line on the plot is 
created from the maximum likelihood 
estimate for the parameter.
You can also specify whether to include an 
inset box of selected statistics in the graph.
Fitting Distributions
Beta
Histogram
fits beta distribution with threshold parameter 
θ
, scale parameter 
σ
, and shape parameters 
α
and 
β
.
Probability plot
specifies a beta probability plot for shape 
parameters 
α
and 
β
.
Quantile-quantile plot
specifies a beta Q-Q plot for shape 
parameters 
α
and 
β
.
Exponential
196
Chapter 10 0 / / Statistics Tasks
Documents you may be interested
Documents you may be interested