﻿

# ghostscript.net convert pdf to image c# : Create a pdf form to fill out and save SDK Library service wpf asp.net html dnn pspp15-part1605

Chapter 15: Statistics
143
This example calculates the harmonic mean, the sum and the minimum values of x and
y grouped by g.
The CELLS subcommand speciﬁes which statistics to calculate. The available statistics
are:
 MEAN The arithmetic mean.
 COUNT The count of the values.
 STDDEV The standard deviation.
 SEMEAN The standard error of the mean.
 SUM The sum of the values.
 MIN The minimum value.
 MAX The maximum value.
 RANGE The diﬀerence between the maximum and minimum values.
 VARIANCE The variance.
 FIRST The ﬁrst value in the category.
 LAST The last value in the category.
 SKEW The skewness.
 SESKEW The standard error of the skewness.
 KURT The kurtosis
 SEKURT The standard error of the kurtosis.
 HARMONIC The harmonic mean.
 GEOMETRIC The geometric mean.
In addition, three special keywords are recognized:
 DEFAULT This is the same as MEAN COUNT STDDEV.
 ALL All of the above statistics will be calculated.
 NONE No statistics will be calculated (only a summary will be shown).
More than one table can be speciﬁed in a single command. Each table is separated by
a‘/’. For example
MEANS TABLES =
c d e BY x
/a b BY x y
/f BY y BY z.
has three tables (the ‘TABLE =’ is optional). The ﬁrst table has three dependent variables
c, d and e and a single categorical variable x. The second table has two dependent variables
aand b, and two categorical variables x and y. The third table has a single dependent
variables f and a categorical variable formed by the combination of y and z.
By default values are omitted from the analysis only if missing values (either system
missing or user missing) for any of the variables directly involved in their calculation are
encountered. This behaviour can be modiﬁed with the /MISSING subcommand. Three
options are possible: TABLE, INCLUDE and DEPENDENT.
Create a pdf form to fill out and save - C# PDF Form Data fill-in Library: auto fill-in PDF form data in C#.net, ASP.NET, MVC, WinForms, WPF
Online C# Tutorial to Automatically Fill in Field Data to PDF
pdf fillable form creator; convert an existing form into a fillable pdf form
Create a pdf form to fill out and save - VB.NET PDF Form Data fill-in library: auto fill-in PDF form data in vb.net, ASP.NET, MVC, WinForms, WPF
VB.NET PDF Form Data fill-in library: auto fill-in PDF form data in vb.net, ASP.NET, MVC, WinForms, WPF
create a writable pdf form; pdf fillable forms
Chapter 15: Statistics
144
/MISSING = TABLE causes cases to be dropped if any variable is missing in the table
speciﬁcation currently being processed, regardless of whether it is needed to calculate the
statistic.
/MISSING = INCLUDE says that user missing values, either in the dependent variables or
in the categorical variables should be taken at their face value, and not excluded.
/MISSING = DEPENDENT says that user missing values, in the dependent variables should
be taken at their face value, however cases which have user missing values for the categorical
variables should be omitted from the calculation.
15.11 NPAR TESTS
NPAR TESTS
nonparametric test subcommands
.
.
.
[/STATISTICS={DESCRIPTIVES} ]
[/MISSING={ANALYSIS, LISTWISE}{INCLUDE, EXCLUDE} ]
[/METHOD=EXACT [ TIMER [(n)] ] ]
NPAR TESTS performs nonparametric tests. Non parametric tests make very few assump-
tions about the distribution of the data. One or more tests may be speciﬁed by using
the corresponding subcommand. If the /STATISTICS subcommand is also speciﬁed, then
summary statistics are produces for each variable that is the subject of any test.
Certain tests may take a long time to execute, if an exact ﬁgure is required. Therefore,
by default asymptotic approximations are used unless the subcommand /METHOD=EXACT is
speciﬁed. Exact tests give more accurate results, but may take an unacceptably long time
to perform. If the TIMER keyword is used, it sets a maximum time, after which the test will
be abandoned, and a warning message printed. The time, in minutes, should be speciﬁed
in parentheses after the TIMER keyword. If the TIMER keyword is given without this ﬁgure,
then a default value of 5 minutes is used.
15.11.1 Binomial test
[/BINOMIAL[(p)]=var
list[(value1[, value2)] ] ]
The /BINOMIAL subcommand compares the observed distribution of a dichotomous vari-
able with that of a binomial distribution. The variable p speciﬁes the test proportion of
the binomial distribution. The default value of 0.5 is assumed if p is omitted.
If a single value appears after the variable list, then that value is used as the threshold
to partition the observed values. Values less than or equal to the threshold value form the
ﬁrst category. Values greater than the threshold form the second category.
If two values appear after the variable list, then they will be used as the values which a
variable must take to be in the respective category. Cases for which a variable takes a value
equal to neither of the speciﬁed values, take no part in the test for that variable.
C#: XDoc.HTML5 Viewer for .NET Online Help Manual
Click to open edited file in web browser in PDF form which can be printed Click it and click on the document to create a current date Office 2003 and 2007, PDF.
convert pdf forms to fillable; convert word form to fillable pdf
VB.NET PDF: Get Started with PDF Library
Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. pages Dim doc As PDFDocument = PDFDocument.Create(2) ' Save the new created PDF document into
create fillable pdf form; converting pdf to fillable form
Chapter 15: Statistics
145
If no values appear, then the variable must assume dichotomous values. If more than
two distinct, non-missing values for a variable under test are encountered then an error
occurs.
If the test proportion is equal to 0.5, then a two tailed test is reported. For any other test
proportion, a one tailed test is reported. For one tailed tests, if the test proportion is less
than or equal to the observed proportion, then the signiﬁcance of observing the observed
proportion or more is reported. If the test proportion is more than the observed proportion,
then the signiﬁcance of observing the observed proportion or less is reported. That is to
say, the test is always performed in the observed direction.
pspp uses a very precise approximation to the gamma function to compute the binomial
signiﬁcance. Thus, exact results are reported even for very large sample sizes.
15.11.2 Chisquare Test
[/CHISQUARE=var
list[(lo,hi)] [/EXPECTED={EQUAL|f1, f2 .. . fn}] ]
The /CHISQUARE subcommandproduces a chi-square statistic for the diﬀerences between
the expected and observed frequencies of the categories of a variable. Optionally, a range
of values may appear after the variable list. If a range is given, then non integer values are
truncated, and values outside the speciﬁed range are excluded from the analysis.
The /EXPECTED subcommand speciﬁes the expected values of each category. There must
be exactly one non-zero expected value, for each observed category, or the EQUAL keyword
mustbe speciﬁed. You may usethe notation n*f tospecify nconsecutiveexpected categories
all taking a frequency of f. The frequencies given are proportions, not absolute frequencies.
The sum of the frequencies need not be 1. If no /EXPECTED subcommand is given, then
then equal frequencies are expected.
15.11.3 Cochran Q Test
[/COCHRAN = var
list ]
The Cochran Q test is used to test for diﬀerences between three or more groups. The
data for var
list in all cases must assume exactly two distinct values (other than missing
values).
The value of Q will be displayed and its Asymptotic signiﬁcance based on a chi-square
distribution.
15.11.4 Friedman Test
[/FRIEDMAN = var
list ]
The Friedman test is used to test for diﬀerences between repeated measures when there
is no indication that the distributions are normally distributed.
Alist of variables which contain the measured data must be given. The procedure prints
the sum of ranks for each variable, the test statistic and its signiﬁcance.
15.11.5 Kendall’s W Test
[/KENDALL = var
list ]
The Kendall test investigates whether an arbitrary number of related samples come from
the same population. It is identical to the Friedman test except that the additional statistic
VB.NET Image: How to Draw and Cutomize Text Annotation on Image
on document files in VB.NET, including PDF, TIFF & example code in VB class to create, customize, delete Public Partial Class Form1 Inherits Form Public Sub New
create fillable pdf form from word; create a pdf form to fill out and save
C# PDF delete text Library: delete, remove text from PDF file in
Able to pull text out of selected PDF page or all PDF document in String outputFilePath = Program.RootPath + "\\" output.pdf"; doc.Save(outputFilePath);
convert word to pdf fillable form online; change font size in fillable pdf form
Chapter 15: Statistics
146
W, Kendall’s Coeﬃcient of Concordance is printed. It has the range [0,1] — a value of zero
indicates no agreement between the samples whereas a value of unity indicates complete
agreement.
15.11.6 Kolmogorov-Smirnov Test
[/KOLMOGOROV-SMIRNOV ({NORMAL[mu, sigma],UNIFORM[min, max],POIS-
SON [lambda], EXPONENTIAL [scale]}) = var
list ]
The one sample Kolmogorov-Smirnov subcommand is used to test whether or not a
dataset is drawn from a particular distribution. Four distributions are supported, viz:
Normal, Uniform, Poisson and Exponential.
Ideally you should provide the parameters of the distribution against which you wish
to test the data. For example, with the normal distribution the mean (mu)and standard
deviation (sigma) should be given; with the uniform distribution, the minimum (min)and
maximum (max) value should be provided. However, if the parameters are omitted they
will be imputed from the data. Imputing the parameters reduces the power of the test so
should be avoided if possible.
In the following example, two variables score and age are tested to see if they follow a
normal distribution with a mean of 3.5 and a standard deviation of 2.0.
NPAR TESTS
/KOLMOGOROV-SMIRNOV (normal 3.5 2.0) = score age.
If the variables need to be tested against diﬀerent distributions, then a separate sub-
command must be used. For example the following syntax tests score against a normal
distribution with mean of 3.5 and standard deviation of 2.0 whilst age is tested against a
normal distribution of mean 40 and standard deviation 1.5.
NPAR TESTS
/KOLMOGOROV-SMIRNOV (normal 3.5 2.0) = score
/KOLMOGOROV-SMIRNOV (normal 40 1.5) = age.
The abbreviated subcommand K-S may be used in place of KOLMOGOROV-SMIRNOV.
15.11.7 Kruskal-Wallis Test
[/KRUSKAL-WALLIS = var
list BY var (lower, upper) ]
The Kruskal-Wallis test is usedto compare data fromanarbitrary number ofpopulations.
It does not assume normality. The data to be compared are speciﬁed by var
list. The
categorical variable determining the groups to which the data belongs is given by var. The
limits lower and upper specify the valid range of var. Any cases for which var falls outside
[lower, upper] will be ignored.
The mean rank of each group as well as the chi-squared value and signiﬁcance of the test
willbe printed. The abbreviatedsubcommandK-W may beusedinplace of KRUSKAL-WALLIS.
15.11.8 Mann-Whitney U Test
[/MANN-WHITNEY = var
list BY var (group1, group2) ]
The Mann-Whitney subcommand is used to test whether two groups of data come from
diﬀerent populations. The variables to be tested should be speciﬁed in var
list and the
grouping variable, that determines to which group the test variables belong, in var. Var
VB.NET Image: Image and Doc Windows, Web & Mobile Viewers of
Image viewers fill a vital part in document image viewing are JPEG, PNG, BMP, GIF, TIFF, PDF, Word and SDK - Features and Techs. Easy to create the compliant
add fillable fields to pdf online; change pdf to fillable form
VB.NET PDF replace text library: replace text in PDF content in vb
Able to pull text out of selected PDF page or example illustrates how to perform PDF text replacing Replace("RasterEdge", "Image", options) doc.Save("C:\\output
auto fill pdf form fields; convert word form to pdf fillable form
Chapter 15: Statistics
147
may be either a string or an alpha variable. Group1 and group2 specify the two values of
var which determine the groups of the test data. Cases for which the var value is neither
group1 or group2 will be ignored.
The value of the Mann-Whitney U statistic, the Wilcoxon W, and the signiﬁcance will
be printed. The abbreviated subcommand M-W may be used in place of MANN-WHITNEY.
15.11.9 McNemar Test
[/MCNEMAR var
list [ WITH var
list [ (PAIRED) ]]]
Use McNemar’s test to analyse the signiﬁcance of the diﬀerence between pairs of corre-
lated proportions.
If the WITH keyword is omitted, then tests for all combinations of the listed variables are
performed. If the WITH keyword is given, and the (PAIRED) keyword is also given, then the
number of variables preceding WITH must be the same as the number following it. In this
case, tests for each respective pair of variables are performed. If the WITH keyword is given,
but the (PAIRED) keyword is omitted, then tests for each combination of variable preceding
WITH against variable following WITH are performed.
The data in each variable must be dichotomous. If there are more than two distinct
variables an error will occur and the test will not be run.
15.11.10 Median Test
[/MEDIAN [(value)] = var
list BY variable (value1, value2) ]
The median test is used to test whether independent samples come from populations
with a common median. The median of the populations against which the samples are to
be tested may be given in parentheses immediately after the /MEDIAN subcommand. If it is
not given, the median will be imputed from the union of all the samples.
The variables of the samples to be tested should immediately follow the ‘=’ sign. The
keyword BY must come next, and then the grouping variable. Two values in parentheses
should follow. If the ﬁrst value is greater than the second, then a 2 sample test is performed
using these two values to determine the groups. If however, the ﬁrst variable is less than
the second, then a k sample test is conducted and the group values used are all values
encountered which lie in the range [value1,value2].
15.11.11 Runs Test
[/RUNS ({MEAN, MEDIAN, MODE, value}) = var
list ]
The /RUNS subcommand tests whether a data sequence is randomly ordered.
It works by examining the number of times a variable’s value crosses a given threshold.
The desired threshold must be speciﬁed within parentheses. It may either be speciﬁed as a
number or as one of MEAN, MEDIAN or MODE. Following the threshold speciﬁcation comes the
list of variables whose values are to be tested.
The subcommand shows the number of runs, the asymptotic signiﬁcance based on the
length of the data.
15.11.12 Sign Test
[/SIGN var
list [ WITH var
list [ (PAIRED) ]]]
C# PDF: Use C# Code to Add Watermark to PDF Document
Able to create watermark over the top of or anno.Fill.FillType = FillType.Solid; anno.Fill.Solid_Color = new GetPage(0); // add annotation on this pdf page page
create pdf fill in form; convert pdf into fillable form
VB.NET TIFF: Make Custom Annotations on TIFF Image File in VB.NET
one image that can be output as a PDF or any Users are also able to create and edit your own set the property of filled shape obj.Fill = New AnnotationBrush
convert word form to fillable pdf form; convert pdf to form fillable
Chapter 15: Statistics
148
The /SIGN subcommand tests for diﬀerences between medians of the variables listed.
The test does not make any assumptions about the distribution of the data.
If the WITH keyword is omitted, then tests for all combinations of the listed variables are
performed. If the WITH keyword is given, and the (PAIRED) keyword is also given, then the
number of variables preceding WITH must be the same as the number following it. In this
case, tests for each respective pair of variables are performed. If the WITH keyword is given,
but the (PAIRED) keyword is omitted, then tests for each combination of variable preceding
WITH against variable following WITH are performed.
15.11.13 Wilcoxon Matched Pairs Signed Ranks Test
[/WILCOXON var
list [ WITH var
list [ (PAIRED) ]]]
The /WILCOXON subcommand tests for diﬀerences between medians of the variables listed.
The test does not make any assumptions about the variances of the samples. It does however
assume that the distribution is symmetrical.
If the WITH keyword is omitted, then tests for all combinations of the listed variables are
performed. If the WITH keyword is given, and the (PAIRED) keyword is also given, then the
number of variables preceding WITH must be the same as the number following it. In this
case, tests for each respective pair of variables are performed. If the WITH keyword is given,
but the (PAIRED) keyword is omitted, then tests for each combination of variable preceding
WITH against variable following WITH are performed.
15.12 T-TEST
T-TEST
/MISSING={ANALYSIS,LISTWISE}{EXCLUDE,INCLUDE}
/CRITERIA=CI(conﬁdence)
(One Sample mode.)
TESTVAL=test
value
/VARIABLES=var
list
(Independent Samples mode.)
GROUPS=var(value1 [, value2])
/VARIABLES=var
list
(Paired Samples mode.)
PAIRS=var
list [WITH var
list [(PAIRED)] ]
The T-TEST procedure outputs tables used in testing hypotheses about means. It oper-
ates in one of three modes:
 One Sample mode.
 Independent Groups mode.
 Paired mode.
VB.NET PDF Text Extract Library: extract text content from PDF
Extract highlighted text out of PDF document. PDF file, and other formats such as TXT and SVG form. to extract target text content from source PDF document and
create a fillable pdf form in word; create a pdf with fields to fill in
C# Image: C#.NET Code to Add Rectangle Annotation to Images &
C# code below will help developers create a self set filled shape style obj.Fill.Solid_Color = Color powerful & profession imaging controls, PDF document,
convert fillable pdf to html form; converting a word document to a fillable pdf form
Chapter 15: Statistics
149
Each of these modes are described in more detail below. There are two optional subcom-
mands which are common to all modes.
The /CRITERIA subcommand tells pspp the conﬁdence interval used in the tests. The
default value is 0.95.
The MISSING subcommand determines the handling of missing variables. If INCLUDE is
set, then user-missing values are included in the calculations, but system-missing values
are not. If EXCLUDE is set, which is the default, user-missing values are excluded as well as
system-missing values. This is the default.
If LISTWISE is set, then the entire case is excluded from analysis whenever any variable
speciﬁed in the /VARIABLES, /PAIRS or /GROUPS subcommands contains a missing value. If
ANALYSIS is set, then missing values are excluded only in the analysis for which they would
be needed. This is the default.
15.12.1 One Sample Mode
The TESTVAL subcommand invokes the One Sample mode. This mode is used to test a pop-
ulation mean against a hypothesized mean. The value given to the TESTVAL subcommand is
the value against which you wish to test. In this mode, you must also use the /VARIABLES
subcommand to tell pspp which variables you wish to test.
15.12.2 Independent Samples Mode
The GROUPS subcommandinvokes Independent Samples mode or ‘Groups’ mode. This mode
is used to test whether two groups of values have the same population mean. In this mode,
you must also use the /VARIABLES subcommand to tell pspp the dependent variables you
wish to test.
The variable given in the GROUPS subcommand is the independent variable which deter-
mines to which group the samples belong. The values in parentheses are the speciﬁc values
of the independent variable for each group. If the parentheses are omitted and no values
are given, the default values of 1.0 and 2.0 are assumed.
If the independent variable is numeric, it is acceptable to specify only one value inside
the parentheses. If you do this, cases where the independent variable is greater thanor equal
to this value belong to the ﬁrst group, and cases less than this value belong to the second
group. When using this form of the GROUPS subcommand, missing values inthe independent
variable are excluded on a listwise basis, regardless of whether /MISSING=LISTWISE was
speciﬁed.
15.12.3 Paired Samples Mode
The PAIRS subcommand introduces Paired Samples mode. Use this mode when repeated
measures have been taken from the same samples. If the WITH keyword is omitted, then
tables for all combinations of variables given in the PAIRS subcommand are generated. If
the WITH keyword is given, and the (PAIRED) keyword is also given, then the number of
variables preceding WITH must be the same as the number following it. In this case, tables
for each respective pair of variables are generated. In the event that the WITH keyword is
given, but the (PAIRED) keyword is omitted, then tables for each combination of variable
preceding WITH against variable following WITH are generated.
Chapter 15: Statistics
150
15.13 ONEWAY
ONEWAY
[/VARIABLES = ] var
list BY var
/MISSING={ANALYSIS,LISTWISE}{EXCLUDE,INCLUDE}
/CONTRAST= value1 [, value2] ... [,valueN]
/STATISTICS={DESCRIPTIVES,HOMOGENEITY}
/POSTHOC={BONFERRONI, GH, LSD, SCHEFFE, SIDAK, TUKEY, AL-
PHA ([value])}
The ONEWAY procedure performs a one-way analysis of variance of variables factored by
asingle independent variable. It is used to compare the means of a population divided into
more than two groups.
The dependent variables to be analysed should be given in the VARIABLES subcommand.
The list of variables must be followed by the BY keyword and the name of the independent
(or factor) variable.
You can use the STATISTICS subcommand to tell pspp to display ancillary information.
The options accepted are:
 DESCRIPTIVES Displays descriptive statistics about the groups factored by the in-
dependent variable.
 HOMOGENEITY Displays the Levene test of Homogeneity of Variance for the variables
and their groups.
The CONTRAST subcommand is used when you anticipate certain diﬀerences between the
groups. The subcommand must be followed by a list of numerals which are the coeﬃcients
of the groups to be tested. The number of coeﬃcients must correspond to the number of
distinct groups (or values of the independent variable). If the total sum of the coeﬃcients are
not zero, then psppwilldisplay a warning, but will proceed with the analysis. The CONTRAST
subcommand may be given up to 10 times in order to specify diﬀerent contrast tests. The
MISSING subcommand deﬁnes how missing values are handled. If LISTWISE is speciﬁed then
cases which have missing values for the independent variable or any dependent variable will
be ignored. If ANALYSIS is speciﬁed, then cases will be ignored if the independent variable
is missing or if the dependent variable currently being analysed is missing. The default is
ANALYSIS. A setting of EXCLUDE means that variables whose values are user-missing are to
be excluded from the analysis. A setting of INCLUDE means they are to be included. The
default is EXCLUDE.
Using the POSTHOC subcommand you can perform multiple pairwise comparisons on the
data. The following comparison methods are available:
 LSD Least Signiﬁcant Diﬀerence.
 TUKEY Tukey Honestly Signiﬁcant Diﬀerence.
 BONFERRONI Bonferroni test.
 SCHEFFE Scheﬀ´e’s test.
 SIDAK Sidak test.
 GH The Games-Howell test.
The optional syntax ALPHA(value) is used to indicate that value should be used as the
conﬁdence level for which the posthoc tests will be performed. The default is 0.05.
Chapter 15: Statistics
151
15.14 QUICK CLUSTER
QUICK CLUSTER var
list
[/CRITERIA=CLUSTERS(k) [MXITER(max
iter)] CONVERGE(epsilon) [NOINITIAL]]
[/MISSING={EXCLUDE,INCLUDE}{LISTWISE, PAIRWISE}]
[/PRINT={INITIAL}{CLUSTER}]
The QUICK CLUSTER command performs k-means clustering onthe dataset. This is useful
when you wish to allocate cases into clusters of similar values and you already know the
number of clusters.
The minimum speciﬁcation is ‘QUICK CLUSTER’ followed by the names of the
variables which contain the cluster data. Normally you will also want to specify
/CRITERIA=CLUSTERS(k) where k is the number of clusters. If this is not speciﬁed, then k
defaults to 2.
If you use /CRITERIA=NOINITIAL then a naive algorithm to select the initial clusters is
used. This will provide for faster execution but less well separated initial clusters and hence
possibly an inferior ﬁnal result.
QUICK CLUSTER uses an iterative algorithm to select the clusters centers. The subcom-
mand /CRITERIA=MXITER(max_iter) sets the maximum number of iterations. During clas-
siﬁcation, pspp will continue iterating until until max
iter iterations have been done or the
convergence criterion (see below) is fulﬁlled. The default value of max
iter is 2.
If however, you specify /CRITERIA=NOUPDATE then after selecting the initial centers, no
further update to the cluster centers is done. In this case, max
iter, if speciﬁed. is ignored.
The subcommand /CRITERIA=CONVERGE(epsilon) is used to set the convergence crite-
rion. The value of convergence criterion is epsilon times the minimum distance between the
initial cluster centers. Iteration stops when the mean cluster distance between one iteration
and the next is less than the convergence criterion. The default value of epsilon is zero.
The MISSING subcommand determines the handling of missing variables. If INCLUDE is
set, then user-missing values are considered at their face value and not as missing values.
If EXCLUDE is set, which is the default, user-missing values are excluded as well as system-
missing values.
If LISTWISE is set, then the entire case is excluded from the analysis whenever any of the
clustering variables contains a missing value. If PAIRWISE is set, then a case is considered
missing only if all the clustering variables contain missing values. Otherwise it is clustered
on the basis of the non-missing values. The default is LISTWISE.
The PRINT subcommand requests additionaloutput to be printed. If INITIAL is set, then
the initial cluster memberships will be printed. If CLUSTER is set, the cluster memberships
of the individual cases will be displayed (potentially generating lengthy output).
15.15 RANK
RANK
[VARIABLES=] var
list [{A,D}] [BY var
list]
/TIES={MEAN,LOW,HIGH,CONDENSE}
/FRACTION={BLOM,TUKEY,VW,RANKIT}
/PRINT[={YES,NO}
/MISSING={EXCLUDE,INCLUDE}
Chapter 15: Statistics
152
/RANK [INTO var
list]
/NTILES(k) [INTO var
list]
/NORMAL [INTO var
list]
/PERCENT [INTO var
list]
/RFRACTION [INTO var
list]
/PROPORTION [INTO var
list]
/N [INTO var
list]
/SAVAGE [INTO var
list]
The RANK command ranks variables and stores the results into new variables.
The VARIABLES subcommand, which is mandatory, speciﬁes one or more variables whose
values are to be ranked. After each variable, ‘A’ or ‘D’ may appear, indicating that the
variable is to be ranked in ascending or descending order. Ascending is the default. If a
BY keyword appears, it should be followed by a list of variables which are to serve as group
variables. In this case, the cases are gathered into groups, and ranks calculated for each
group.
The TIES subcommand speciﬁes how tied values are to be treated. The default is to
take the mean value of all the tied cases.
The FRACTION subcommand speciﬁes how proportional ranks are to be calculated. This
only has any eﬀect if NORMAL or PROPORTIONAL rank functions are requested.
The PRINT subcommand may be used to specify that a summary of the rank variables
created should appear in the output.
The function subcommands are RANK, NTILES, NORMAL, PERCENT, RFRACTION,
PROPORTION and SAVAGE. Any number of function subcommands may appear. If none
are given, then the default is RANK. The NTILES subcommand must take an integer
specifying the number of partitions into which values should be ranked. Each subcommand
may be followed by the INTO keyword and a list of variables which are the variables to be
created and receive the rank scores. There may be as many variables speciﬁed as there are
variables named on the VARIABLES subcommand. If fewer are speciﬁed, then the variable
names are automatically created.
The MISSING subcommand determines how user missing values are to be treated. A
setting of EXCLUDE means that variables whose values are user-missing are to be excluded
from the rank scores. A setting of INCLUDE means they are to be included. The default is
EXCLUDE.
15.16 REGRESSION
The REGRESSION procedure ﬁts linear models to data via least-squares estimation. The pro-
cedure is appropriate for data which satisfy those assumptions typical in linear regression:
 The data set contains n observations of a dependent variable, say Y
1
;:::;Y
n
, and n
observations of one or more explanatory variables. Let X
11
;X
12
,. . ., X
1n
denote the
nobservations of the ﬁrst explanatory variable; X
21
,. ..,X
2n
denote the n observations
of the second explanatory variable; X
k1
,.. .,X
kn
denote the n observations of the kth
explanatory variable.
 The dependent variable Y has the following relationship to the explanatory variables:
Y
i
= b
0
+b
1
X
1i
+::: + b
k
X
ki
+Z
i
where b
0
;b
1
;:::;b
k
are unknown coeﬃcients, and