﻿
41

1.96
1
1.96
1
aw
w
w
a

1.96
1
1.96
2
aw
w
w
a
where 1.96 is the approximate quantile for the normal distribution corresponding to a 95% CI (the
actual value used is 1.959964). The bootstrapped confidence interval is
*
1
*
1
2
1
,
a
R
a
R
t
t
No interpolation is used if the index is not an integer.
Missing data: Supported by deletion.
One-sample tests
Tests for whether a single sample (single column of data) comes from a population with a given,
often hypothetical, mean or median. For example, are a number of oxygen isotope values from sea
shells (single sample) the same as average seawater composition (given mean)? The given test value
must be typed in.
One-sample t test for given mean
0
(parametric)
Sample mean and standard deviation are estimated as described above under Univariate statistics.
The 95% confidence interval for the difference in means is based on the standard error for the
estimate of the mean, and the t distribution. Normal distribution is assumed. With s the estimate of
the sample standard deviation, the confidence interval is
n
s
t
x
n
s
t
x
n
n
2, 1
0
2, 1
0
,
Here, t has n-1 degrees of freedom, and 1-α = 0.95 for a 95% confidence interval.
The t test has null hypothesis
H
0
: The samples is taken from a population with mean
0

The test statistic is
42
n
s
x
t
0
One-sample Wilcoxon signed-rank test for given median M (nonparametric)
The one-sample Wilcoxon test has null hypothesis
H
0
: The samples is taken from a population with median M.
All values equal to M are first removed by the program. Then the absolute values of the differences
|d
i
| are ranked (R
i
), with mean ranks assigned for ties. The sum of ranks for pairs where d
i
is positive
is W
+
. The sum of ranks for pairs where d
i
is negative is W
-
. The reported test statistic is
W = max(W
+
W
-
(note that there are several other, equivalent versions of this test, reporting other statistics).
For large n (say n>10), the large-sample approximation to p can be used. This depends on the normal
distribution of the test statistic W:
4
( 1)
( )
nn
EW
 

48
24
1
1 2
3
g
g
g
f
f
n
nn
VarW
The last term is a correction for ties, where f
g
is the number of elements in tie g. The resulting z is
reported, together with the p value.
For n<13, an exact p value is computed, by complete enumeration of all possible reassignments
(there are 2
n
of them, i.e. 4096 for n=12).  This is the preferred p value, if available.
Missing data: Supported by deletion of the row.
43
Two-sample tests
A number of classical statistics and tests for comparing two univariate samples, as given in two
columns. It is also possible to specify the two groups using a single column of values and an
additional Group column. Missing data are disregarded.
t test and related tests for equal means
Sample statistics
Means and variances are estimated as described above under Univariate statistics. The 95%
confidence interval for the mean is based on the standard error for the estimate of the mean, and
the t distribution. Normal distribution is assumed. With s the estimate of the standard deviation, the
confidence interval is
n
s
x t
n
s
x t
n
n
2, 1
2, 1
,
Here, t has n-1 degrees of freedom, and 1-α = 0.95 for a 95% confidence interval.
The 95% confidence interval for the difference between the means accepts unequal sample sizes:
D
df
D
df
s
x y y t
s
x y y t
2,
2,
,
 
 
44
where
2
2
y y
x x
SSE
i
i
 
1
1
2
1
 
n
n
df
df
SSE
MSE
/
2
1
1
1
2
n
n
n
h
h
D
n
MSE
s
2
The confidence interval is computed for the larger mean minus the smaller, i.e. the center of the CI
should always be positive. The confidence interval for the difference in means is also estimated by
bootstrapping (simple bootstrap), with the given number of replicates (default 9999).
t test
The t test has null hypothesis
H
0
: The two samples are taken from populations with equal means.
The t test assumes normal distributions and equal variances.
From the standard error s
D
of the difference of the means given above, the test statistic is
D
s
x y
t
Unequal variance t test
The unequal variance t test is also known as the Welch test. It can be used as an alternative to the
basic t test when variances are very different, although it can be argued that testing for difference in
the means in this case is questionable. The test statistic is
2
1
)
Var(
)
Var(
y n
x n
x y
t
The number of degrees of freedom is
45
1
)
Var(
1
)
Var(
)
Var(
)
Var(
2
2
2
1
2
1
2
2
1
n
y n
n
x n
n
y
n
x
df
Monte Carlo permutation test
The permutation test for equality of means uses the absolute difference in means as test statistic.
This is equivalent to using the t statistic. The permutation test is non-parametric with few
assumptions, but the two samples are assumed to be equal in distribution if the null hypothesis is
true. The number of permutations can be set by the user. The power of the test is limited by the
sample size – significance at the p<0.05 level can only be achieved for n>3 in each sample.
Exact permutation test
As the Monte Carlo permutation test, but all possible permutations are computed. Only available if
the sum of the two sample sizes is less than 27.
F test for equal variances
46
The F test has null hypothesis
H
0
: The two samples are taken from populations with equal variance.
Normal distribution is assumed. The F statistic is the ratio of the larger variance to the smaller. The
significance is two-tailed, with n
1
and n
2
degrees of freedom.
Monte Carlo and exact permutation tests on the F statistic are computed as for the t test above.
Mann-Whitney test for equal medians
The two-tailed (Wilcoxon) Mann-Whitney U test can be used to test whether the medians of two
independent samples are different. It is a non-parametric test and does not assume normal
distribution, but does assume equal-shaped distribution in both groups. The null hypothesis is
H
0
: The two samples are taken from populations with equal medians.
For each value in sample 1, count the number of values in sample 2 that are smaller than it (ties
count 0.5). The total of these counts is the test statistic U (sometimes called T). If the value of U is
smaller when reversing the order of samples, this value is chosen instead (it can be shown that
U
1
+U
2
=n
1
n
2
).
The program computes an asymptotic  approximation to p based on the normal distribution (two-
tailed), which is only valid for large n. It includes a continuity correction and a correction for ties:
47
1
12
2 0.5
3
3
1 2
1 2
 
nn
f
f
n
nn n
nn
U
z
g
g
g
where n=n
1
+n
2
and f
g
is the number of elements in tie g.
A Monte Carlo value based on the given number of random permutations (default 9999) is also given
– the purpose of this is mainly as a control on the asymptotic value.
For n
1
+n
2
<=30 (e.g. 15 values in each group), an exact p value is given, based on all possible group
assignments. If available, always use this exact value. For larger samples, the asymptotic
approximation is quite accurate.
Mood’s median test for equal medians
The median test is an alternative to the Mann-Whitney test for equal medians. The median test has
low power, and the Mann-Whitney test is therefore usually preferable. However, there may be cases
with strong outliers where the Mood͛s test may perform better.
The test simply counts the number of values in each sample that are above or below the pooled
median, producing a 2x2 contingency table that is tested with a standard chi-squared test with two
degrees of freedom, without Yate͛s correction.
Kolmogorov-Smirnov test for equal distributions
The Kolmogorov-Smirnov test is a nonparametric test for overall equal distribution of two univariate
samples. In other words, it does not test specifically for equality of mean, variance or any other
parameter. The null hypothesis is H
0
: The two samples are taken from populations with equal
distribution.