Математическая статистика, весна 2015: Критерии...
Transcript of Математическая статистика, весна 2015: Критерии...
Лекция 4. Параметрические и непараметрическиекритерии однородности
Грауэр Л.В., Архипова О.А.
CS Center
Санкт-Петербург, 2015
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 1 / 44
Cодержание
Содержание
1 Проверка гипотез о равенстве параметров двух нормально распределенныхгенеральных совокупностей
Критерий ФишераКритерий Стьюдента
2 Однофакторный дисперсионный анализ
3 Непараметрические критерии однородностиКритерий однородности ВилкоксонаКритерий Манна-Уитни
4 Непараметрические критерии анализа парных повторных наблюденийКритерий знаковКритерий знаковых ранговых сумм Вилкоксона
5 Критерий Краскела-Уоллиса
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 2 / 44
Проверка гипотез...
Проверка гипотез о равенствепараметров двух нормальнораспределенных генеральных
совокупностей
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 3 / 44
Проверка гипотез... Критерий Фишера
Критерий Фишера
Пусть имеются две независимые генеральные совокупности η свыборкой X[m] и ξ с выборкой Y[n]. Будем считать, что η подчиняетсянормальному распределению N(a1, σ
21) и ξ подчиняется нормальному
распределению N(a2, σ22), причем, математические ожидания a1, a2 и
дисперсии σ21 и σ2
2 неизвестны.Сформулируем нулевую и альтернативную гипотезы:
H0 : σ21 = σ2
2.H1 : σ2
1 6= σ22.
Альтернативная гипотеза является двусторонней.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 4 / 44
Проверка гипотез... Критерий Фишера
Тогда(m − 1)s2
X/σ21 ∼ χ2
m−1,
(n − 1)s2Y /σ
22 ∼ χ2
n−1,
где
s2X =
1
m − 1
m∑i=1
(Xi − X )2,
s2Y =
1
n − 1
n∑i=1
(Yi − Y )2.
В соответствии с определением распределения Фишера:
Fm−1,n−1 =s2X
s2Y
σ22
σ21
∼ Fm−1,n−1.
Тогда при справедливости нулевой гипотезы:
s2X
s2Y
∼ Fm−1,n−1.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 5 / 44
Проверка гипотез... Критерий Фишера
Пусть uα2, u1−α
2— квантили распределения Фишера Fm−1,n−1. Можно
сформулировать критерий проверки гипотезы H0 при альтернативе H1
с вероятностью ошибки первого рода α (уровнем значимостикритерия):
Если s2X
s2Y∈ [uα
2, u1−α
2], то принимается гипотеза H0.
Если s2X
s2Y/∈ [uα
2, u1−α
2], то принимается гипотеза H1.
Если альтернативная гипотеза H1 односторонняя, т. е. σ21 > σ2
2, то вкачестве критической области для нулевой гипотезы рассматриваетсяS = (u1−α,+∞), где α — вероятность ошибки первого рода. Случайσ2
2 > σ21 сводится к предыдущему переменой мест выборок.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 6 / 44
Проверка гипотез... Критерий Стьюдента
Критерий Стьюдента
Пусть заданы независимые случайные величины η ∼ N(a1, σ21) с
выборкой X[m] и ξ ∼ N(a2, σ22) с выборкой Y[n]. Сформулируем
нулевую и альтернативную двустороннюю гипотезы:H0 : a1 = a2.H1 : a1 6= a2.
Рассмотрим три случая:1 Дисперсии σ2
1, σ22 известны.
2 Дисперсии неизвестны, но есть основания считать, чтоσ2
1 = σ22 = σ2.
3 Дисперсии неизвестны и неравны σ21 6= σ2
2.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 7 / 44
Проверка гипотез... Критерий Стьюдента
Дисперсии σ21, σ
22 известны
1) Дисперсии σ21, σ
22 известны, тогда используем статистику
X − Y√σ2
1m +
σ22n
∼ N(0, 1),
при условии, что верна гипотеза H0.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 8 / 44
Проверка гипотез... Критерий Стьюдента
Получаем критерий с вероятностью ошибки первого рода α:Если справедливо неравенство:∣∣X − Y
∣∣√σ2
1m +
σ22n
6 u1−α2,
то принимается гипотеза H0, где u1−α2— квантиль уровня 1− α/2
стандартного нормального распределения.Если справедливо неравенство:∣∣X − Y
∣∣√σ2
1m +
σ22n
> u1−α2,
то принимается гипотеза H1.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 9 / 44
Проверка гипотез... Критерий Стьюдента
Для правосторонней альтернативной гипотезы H1 : a1 > a2
критическая область для H0 будет выглядеть следующим образом:
S = (u1−α,+∞).
Для левосторонней альтернативной гипотезы H1 : a1 < a2 критическаяобласть для H0 будет следующей:
S = (−∞, uα).
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 10 / 44
Проверка гипотез... Критерий Стьюдента
Дисперсии неизвестны, но σ21 = σ2
2 = σ2
2) Дисперсии неизвестны, но есть основания считать, чтоσ2
1 = σ22 = σ2.
Статистики(m − 1)s2
X
σ2,
(n − 1)s2Y
σ2
взаимно независимы и имеют распределения χ2m−1 и χ2
n−1
соответственно, тогда статистика
s2X (m − 1) + s2
Y (n − 1)
σ2
подчиняется распределению хи-квадрат с m + n − 2 степенямисвободы.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 11 / 44
Проверка гипотез... Критерий Стьюдента
Если верна гипотеза H0, то статистика
t(0)n+m−2 =
X − Y√m+nmn
√s2X (m−1)+s2
Y (n−1)m+n−2
подчиняется распределению Стьюдента Tn+m−2 с n + m − 2 степенямисвободы.
Если верна гипотеза H1, то статистика
tn+m−2 =X − Y + (a2 − a1)√m+nmn
√s2X (m−1)+s2
Y (n−1)m+n−2
подчиняется распределению Стьюдента Tn+m−2 с n + m − 2 степенямисвободы.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 12 / 44
Проверка гипотез... Критерий Стьюдента
Сформулируем критерий с вероятностью ошибки первого рода α:
Если |t(0)n+m−2| 6 t1−α
2, где t1−α
2— квантиль распределения
Стьюдента с n + m − 2 степенями свободы уровня 1− α/2, топринимается гипотеза H0.
Если |t(0)n+m−2| > t1−α
2, то принимается гипотеза H1.
Для правосторонней альтернативной гипотезы H1 : a1 > a2
критическая область для H0 при использовании статистики t0m+n−2
будет следующей: S = (t1−α,+∞).Для левосторонней альтернативной гипотезы H1 : a1 < a2 критическаяобласть для H0 при использовании статистики t0
n+m−2 будетследующей: S = (−∞, tα).Границы t1−α и tα — квантили распределения Стьюдента с (n + m− 2)степенями свободы уровней 1− α и α соответственно.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 13 / 44
Проверка гипотез... Критерий Стьюдента
Дисперсии неизвестны и неравны σ21 6= σ2
2
3) Пусть дисперсии неизвестны и неравны σ21 6= σ2
2.Если верна гипотеза H0, то статистика
tK =X − Y√s2Xm +
s2Yn
подчиняется распределению Стьюдента TK с K степенями свободы:
K =
(s2Xm +
s2Yn
)2
(s2X /m)2
m−1 +(s2
Y /n)2
n−1
(1)
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 14 / 44
Проверка гипотез... Критерий Стьюдента
Сформулируем критерий с вероятностью ошибки первого рода α:Если |tK | 6 t1−α
2, где t1−α
2— квантиль распределения Стьюдента
с K степенями свободы уровня 1− α/2, то принимается гипотезаH0.Если |tK | > t1−α
2, то принимается гипотеза H1.
Для правосторонней альтернативной гипотезы H1 : a1 > a2
критическая область для H0 при использовании статистики tK будетследующей: S = (t1−α,+∞).Для левосторонней альтернативной гипотезы H1 : a1 < a2 критическаяобласть для H0 при использовании статистики tK будет следующей:S = (−∞, tα).Границы t1−α и tα — квантили распределения Стьюдента с Kстепенями свободы уровней 1− α и α соответственно.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 15 / 44
Проверка гипотез... Критерий Стьюдента
Критерий Стьюдента для парных выборок
Пусть задана двумерная случайная величина (η, ξ) с парной выборкой(X ,Y )[n]. Сформулируем нулевую и альтернативную двустороннююгипотезы:
H0 : a1 = a2.H1 : a1 6= a2.
a1 — математическое ожидание η, a2 — математическое ожидание ξ.
Рассмотрим случайную величину ζ = η − ξ.Тогда Zi = Xi − Yi , i = 1, . . . , n, — выборка наблюдений случайнойвеличины ζ.Проверяемые гипотезы примут вид
H0 : a = 0.H1 : a 6= 0.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 16 / 44
Проверка гипотез... Критерий Стьюдента
Z =1
n
n∑i=1
(Xi − Yi ) = X − Y ,
S2Z =
1
n − 1
n∑i=1
((Xi − Yi )− Z )2.
Отметим, что в случае положительной корреляции между η и ξдисперсия Z меньше, чем в случае независимых случайных величин
D(Z ) = D(X ) + D(Y )− 2KX ,Y .
Пусть ζ ∼ N(a, σ).Если верна гипотеза H0, то статистика
tn−1 =Z
SZ/√n
подчиняется распределению Стьюдента Tn−1 с n − 1 степенямисвободы.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 17 / 44
Проверка гипотез... Критерий Стьюдента
Сформулируем критерий с вероятностью ошибки первого рода α:Если |tn−1| 6 t1−α
2, где t1−α
2— квантиль распределения
Стьюдента с n − 1 степенями свободы уровня 1− α/2, топринимается гипотеза H0.Если |tn−1| > t1−α
2, то принимается гипотеза H1.
Для правосторонней альтернативной гипотезы H1 : a1 > a2
критическая область для H0 при использовании статистики tn−1 будетследующей: S = (t1−α,+∞).Для левосторонней альтернативной гипотезы H1 : a1 < a2 критическаяобласть для H0 при использовании статистики tn−1 будет следующей:S = (−∞, tα).Границы t1−α и tα — квантили распределения Стьюдента с n − 1степенями свободы уровней 1− α и α соответственно.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 18 / 44
Однофакторный дисперсионный анализ
Однофакторный дисперсионный анализ
Однофакторный дисперсионный анализ является обобщениемT -критерия для двух выборок из генеральной совокупности.Пусть число выборок k > 2:
X11 X12 . . . X1k
X21 X22 . . . X2k...
......
Xn11 Xn22 . . . Xnkk
N(a1, σ2) N(a2, σ
2) . . . N(ak , σ2)
Пусть все выборки взаимно независимы между собой, при этомвыборка (X1i , . . . ,Xni i ) взята из генеральной совокупности сраспределением N(ai , σ
2). Элементы каждой выборки тоже, конечно,взаимно независимы.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 19 / 44
Однофакторный дисперсионный анализ
Выдвигается гипотеза H0 : a1 = a2 = . . . = ak при альтернативнойгипотезе H1, которая заключается в отрицании гипотезы H0.
Рассмотрим следующие величины:
X·j =1
nj
nj∑i=1
Xij , X·· =1
N
k∑j=1
nj∑i=1
Xij , N =k∑
j=1
nj ,
где j — номер выборки.Независимо от справедливости гипотезы H0:
nj∑i=1
(Xij − X·j)
σ2∼ χ2
nj−1.
Следовательно,
S1 =k∑
j=1
nj∑i=1
(Xij − X·j)2
σ2∼ χ2
N−k .
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 20 / 44
Однофакторный дисперсионный анализ
Рассмотрим величину
(X·j − aj)
σ
√nj ∼ N(0, 1).
Пусть гипотеза H0 верна. Рассмотри статистику S2 следующего вида:
S2 =1
σ2
k∑j=1
nj(X·j − X··)2.
S2 =1
σ2
k∑j=1
nj(X·j − X··)2 =
=k∑
j=1
[√nj(X·j − a)
σ
]2
−
k∑j=1
√njN
√nj(X·j − a)
σ
2
∼ χ2k−1
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 21 / 44
Однофакторный дисперсионный анализ
Cтатистики S1 и S2 взаимно независимы.При выполнении гипотезы H0 статистика
F =S2/(k − 1)
S1/(N − k)∼ Fk−1,N−k
подчиняется распределению Фишера с k − 1 и N − k степенямисвободы числителя и знаменателя соответственно.Заметим, что статистика F не зависит от σ2.Большие значения статистики F свидетельствуют против нулевойгипотезы, поэтому критическая область S для H0 с вероятностьюошибки первого рода α имеет вид: S = (u1−α,k−1,N−k ;∞), гдеu1−α,k−1,N−k — квантиль уровня 1− α распределения ФишераFk−1,N−k .
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 22 / 44
Однофакторный дисперсионный анализ
Метод линейных контрастов
Если нулевая гипотеза отклоняется, то требуется определить, какие именногруппы имеют значимое различие средних.Линейный контраст Lk определяется как линейная комбинация
Lk =k∑
j=1
cjaj ,
где cj , j = 1, . . . , k , — задаваемые константы, причем∑k
j=1 cj = 0.Оценка линейного контраста имеет следующий вид:
Lk =k∑
j=1
cj Xj .
Оценка дисперсии Lk вычисляется по формуле:
S2Lk
=k∑
j=1
c2j
njσ2 =
S1σ2
N − k
k∑j=1
c2j
nj=
k∑j=1
nj∑i=1
(Xij − X·j)2
N − k
k∑j=1
c2j
nj.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 23 / 44
Однофакторный дисперсионный анализ
Доверительный интервал для Lk имеет вид(Lk − SLk
√(k − 1)u1−α,k−1,N−k ,
Lk + SLk
√(k − 1)u1−α,k−1,N−k
), (2)
где u1−α,k−1,N−k — квантиль распределния Фишера с (k − 1,N − k)степенями свободы уровня 1− α.
Лемма 1 (Метод Шеффе)
Для любой совокупности векторов (c1, . . . , ck):∑k
j=1 cj = 0,вероятность одновременного выполнения неравенств∣∣∣∣∣∣
k∑j=1
cj(aj − Xj)
∣∣∣∣∣∣ < SLk
√(k − 1)u1−α,k−1,N−k
не меньше 1− α.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 24 / 44
Однофакторный дисперсионный анализ
Нулевая гипотеза для контраста H0 : Lk = 0 принимается на уровнезначимости α, если ноль содержится в доверительном интервале дляLk с доверительной вероятностью 1-α.
Рассмотрим нулевые гипотезы H rs0 : ar = as , s 6= r против
двусторонних альтернативных гипотез H rs1 : ar 6= as , s 6= r .
Гипотеза H rs0 : ar = as равносильна гипотезе H rs
0 : Lkrs = 0 с линейнымконтрастом вида
Lkrs = ar − as , cr = 1, cs = −1, cj = 0, j 6= r , j 6= s.
Гипотеза H rs0 принимается, если ноль содержится в доверительном
интервале (2) для контраста Lkrs , в противном случае H rs0 отклоняется.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 25 / 44
Непараметрические критерии однородности
Непараметрические критерииоднородности
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 26 / 44
Непараметрические критерии однородности
Пусть имеются две независимые выборки X[n] = (X1, . . . ,Xn) иY[m] = (Y1, . . . ,Ym) из двух генеральных совокупностей снепрерывными функциями распределения равными соответственно Fи G . Сформулируем гипотезы:
H0 : F (x) = G (x) для всех x ∈ R.H1 : F (x) > G (x) для всех x ∈ R — правосторонняяальтернативная гипотеза.H
′1 : F (x) 6 G (x) для всех x ∈ R — левосторонняя
альтернативная гипотеза.H
′′1 : F (x) 6= G (x) для всех x ∈ R — двусторонняя альтернативная
гипотеза (т.е. выполнена H1 или H′1).
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 27 / 44
Непараметрические критерии однородности Критерий однородности Вилкоксона
Критерий однородности Вилкоксона
Без ограничения общности будем считать, что m 6 n. Составимобъединенную выборку Z[n+m] = (X[n],Y[m]). Построим вариационныйряд объединенной выборки:
z(1) < z(2) < . . . < z(m+n).
Если распределения генеральных совокупностей непрерывны, тосовпадения возможны только с нулевой вероятностью. В дальнейшембудем предполагать, что совпадений нет.Найдем, какие места занимают в вариационном ряду, построенном пообъединенной выборке, элементы выборки Y[m]. Назовем эти номерарангами элементов выборки Y[m] в объединенной выборке Z[n+m]:
rank(Y1) = s1, rank(Y2) = s2, . . . , rank(Ym) = sm.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 28 / 44
Непараметрические критерии однородности Критерий однородности Вилкоксона
Рассмотрим статистку критерия:
W =m∑i=1
si .
Статистика W находится в промежутке
[m(m + 1)/2;mn + m(m + 1)/2].
Распределение статистики Вилкоксона W является симметричнымотносительно середины данного промежутка при условиисправедливости нулевой гипотезы H0.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 29 / 44
Непараметрические критерии однородности Критерий однородности Вилкоксона
Если справедлива альтернативная гипотеза H1, то чаще будутвстречаться события xi < yj , то есть, распределение статистики Wперестанет быть симметричным относительно середины и будетсдвинуто вправо.Если справедлива альтернативная гипотеза H
′1, то распределение
статистики W будет сдвинуто влево, так как чаще будут выполнятьсясобытия xi > yj .Если выбрана альтернативой гипотеза H1, то критическая область длянулевой гипотезы H0 будет иметь вид:
S =
[c1,mn +
m(m + 1)
2
].
Если выбрана альтернативой гипотеза H′1, то критическая область для
нулевой гипотезы H0 будет иметь вид:
S =
[m(m + 1)
2, c2
].
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 30 / 44
Непараметрические критерии однородности Критерий однородности Вилкоксона
Если выбрана альтернативой гипотеза H′′1 , то критическая область для
нулевой гипотезы H0 будет иметь вид:
S =
[m(m + 1)
2, c3
]∪[c4,mn +
m(m + 1)
2
].
В качестве искомых констант выбираются квантили распределения.При этом, константы c1 и c2 симметричны относительно серединыпромежутка [m(m + 1)/2,mn + m(m + 1)/2]. Также симметричноотносительно середины этого промежутка расположены константы c3 иc4.Общее требование заключается в том, что вероятность попаданиястатистики W в критическую область при условии справедливостинулевой гипотезы H0 должна быть равна заданному значению α:
P0{W ∈ S} = α.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 31 / 44
Непараметрические критерии однородности Критерий однородности Вилкоксона
Для больших объемов выборок можно воспользоваться асимптотическимисвойствами статистикиW : Нормированная и центрированная статистикаВилкоксона:
W =W − m(m+n+1)
2√mn(m+n+1)
12
асимптотически имеет стандартное нормальное распределение. Нулеваягипотеза (против альтернативы H ′′1 ) отвергается, если |W | > u1−α/2 ,где uα есть α-квантиль стандартного нормального распределения.В случае совпадающих наблюдений выражение в знаменателе необходимозаменить на следующее:
mn(n + m + 1)
12
[1−
∑ki=1 ti (t
2i − 1)
(n + m)(n + m − 1)(n + m + 1)
]1/2
.
Здесь k - количество только тех связок, в которые входят ранги какодной, так и другой выборок, t1, . . . , tk - их размеры. Совпадения, целикомсостоящие из элементов одной и той же выборки, на величину W невлияют.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 32 / 44
Непараметрические критерии однородности Критерий Манна-Уитни
Критерий Манна-Уитни
Будем проверять те же нулевую и альтернативные гипотезы, что и вкритерии Вилкоксона.Запишем статистику критерия Манна-Уитни:
U =n∑
i=1
m∑j=1
I{Xi < Yj},
где
I{Xi < Yj} =
{1, Xi < Yj ;0, Xi > Yj .
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 33 / 44
Непараметрические критерии однородности Критерий Манна-Уитни
Находим в таблице [3] критические значения распределения уровня αстатистики Манна-Уитни U при условии справедливости гипотезыоднородности H0: Uleft = Uα,n,m, Uright = Vα,n,m и сравниваем с нимистатистику критерия.Если U > Uright , то нулевая гипотеза отвергается в пользуправосторонней альтернативной гипотезы H1.Если U 6 Uleft , то нулевая гипотеза отвергается в пользулевосторонней альтернативной гипотезы H
′1.
Для случая двусторонней альтернативы H′′1 находятся точки
Uright = Vα/2,n,m и Uleft = Uα/2,n,m, и нулевая гипотеза H0 отвергаетсяпри выполнении любого из неравенств: U > Uright , U 6 Uleft .
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 34 / 44
Непараметрические критерии однородности Критерий Манна-Уитни
Взаимосвязь критериев Вилкоксона и Манна-Уитни
Статистики Вилкоксона и Манна-Уитни связаны между собойследующим соотношением:
W = U +m(m + 1)
2.
Полученная формула позволяет пересчитывать значение однойстатистики в другую и пользоваться тем распределением, котороеболее удобно для вычислений.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 35 / 44
Парные повторные наблюдения
Непараметрические критерии анализа парных повторныхнаблюдений
Рассмотрим две зависимые выборки: X[n] = (X1, . . . ,Xn) иY[n] = (Y1, . . . ,Yn) из генеральных совокупностей с функциямираспределения равными соответственно F (x) и G (x), которые считаемнепрерывными.Выборки имеют одинаковый объем, и зависимость носит следующийхарактер. Внутри каждой из выборок элементы независимы, но Xi и Yi
— зависимые наблюдения. Чаще всего i означает номер объекта, а Xi
и Yi — два наблюдения над одним и тем же объектом до и посленекоторого воздействия.Сформулируем гипотезы:
H0 : F (x) = G (x) для всех x ∈ R.H1 : F (x) > G (x) для всех x ∈ R.H
′1 : F (x) 6 G (x) для всех x ∈ R.
H′′1 : F (x) 6= G (x) для всех x ∈ R.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 36 / 44
Парные повторные наблюдения Критерий знаков
Критерий знаков
Составим разности zi = Xi − Yi . Случайные величины zi , i = 1, . . . , n,взаимно независимы и одинаково распределены. Переформулируемгипотезы:
H0 : P{zi < 0} = P{zi > 0} = 1/2.H1 : P{zi < 0} > P{zi > 0}.H
′1 : P{zi < 0} < P{zi > 0}.
H′′1 : P{zi < 0} 6= P{zi > 0}.
Так как в гипотезах фигурируют вероятности, то можемрассматривать схему Бернулли, где событие zi < 0 означает успех.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 37 / 44
Парные повторные наблюдения Критерий знаков
Cтатистика критерия:
L =n∑
i=1
I{zi < 0}.
При выполнении гипотезы H0 статистика L подчиняетсябиномиальному распределению с вероятностью успеха p = 1/2.Критическая область для нулевой гипотезы при выборе
альтернативной гипотезы H1 имеет вид: (c1, n];альтернативной гипотезы H
′1 имеет вид: [0, c2);
альтернативной гипотезы H′′1 имеет вид: [0, c3) ∪ (c4, n].
Для нахождения констант c1, c2, c3, c4 можно использовать таблицывероятностей биномиального распределения, следуя общему правила:попадание статистики критерия L в критическую область при условиивыполнения гипотезы H0 равно α.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 38 / 44
Парные повторные наблюдения Критерий знаковых ранговых сумм Вилкоксона
Критерий знаковых ранговых сумм Вилкоксона
Составим разности zi = Xi − Yi . Предполагаем, что величины zi независят друг от друга. Рассмотрим случаи, когда zi < 0 и zi > 0.Рассмотрим гипотезы:
H0 : P{zi < 0} = P{zi > 0} = 1/2.H1 : P{zi < 0} > P{zi > 0}.H
′1 : P{zi < 0} < P{zi > 0}.
H′′1 : P{zi < 0} 6= P{zi > 0}.
Построим вариационный ряд из модулей разностей:|z1|, . . ., |zn|.Сопоставим каждому элементу вариационного ряда ранг:s1 = rank(|z1|), . . ., sn = rank(|zn|).
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 39 / 44
Парные повторные наблюдения Критерий знаковых ранговых сумм Вилкоксона
Составим ранговую статистику
U =n∑
i=1
Ψi si , где Ψi =
{1, zi > 0;0, zi < 0.
Используем таблицы [3] для нахождения критических значенийстатистики U и сравним их с полученным значением статистики.При выборе левосторонней альтернативы H1 критическая областьимеет вид: [0, c1].При выборе правосторонней альтернативы H
′1 критическая область
имеет вид: [c2, n(n + 1)/2].При выборе двусторонней альтернативы H
′′1 критическая область
имеет вид: [0, c3] ∪ [c4, n(n + 1)/2].Вероятность попадания статистики критерия U в критическую областьпри условии выполнения гипотезы H0 равно α.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 40 / 44
Критерий Краскела-Уоллиса
Критерий Краскела-Уоллиса
Пусть имеются k независимых выборок X 1[n] = (X 1
1 , . . . ,X1n1
),X 1
[n] = (X 21 , . . . ,X
2n2
), . . . , X k[n] = (X k
1 , . . . ,Xknk
) из k > 2 генеральныхсовокупностей с непрерывными функциями распределения равнымисоответственно F1, F2, . . . , Fk .
Сформулируем гипотезы:H0 : F1(x) = F2(x) = . . . = Fk(x) для всех x ∈ R.H1 : F1(x) = F2(x − δ2) = . . . = Fk(x − δk) для всех x ∈ R
Упорядочим все N =∑k
i=1 ni элементов выборок по возрастанию иобозначим R j
i ранг j-го элемента i-й выборки в полученномвариационном ряду.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 41 / 44
Критерий Краскела-Уоллиса
Статистика критерия Краскела-Уоллиса для проверки гипотезы оналичии сдвига в параметрах положения сравниваемых выборок имеетвид
H =k∑
i=1
(1− ni
N
) Ri − N+12√
(N−ni )(N+1)12ni
12
=12
N(N + 1)
k∑i=1
R2i
ni− 3(N + 1),
где
Ri =
ni∑j=1
R ji ; Ri =
Ri
ni.
При наличии одинаковых значений величин из разных выборокнеобходимо использовать модифицированную статистику
H∗ = H
1−
q∑j=1
Tj
N3 − N
−1
,
где Tj = t3j − tj , tj — размер j-й группы одинаковых элементов; q —
количество групп одинаковых элементов.Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 42 / 44
Критерий Краскела-Уоллиса
Гипотеза сдвига отклоняется на уровне значимости α, если H ≥ Hα,где Hα — критическое значение, при k ≤ 5 и ni ≤ 15 вычисляемое потаблицам.При ni ≥ 15 справедлива аппроксимация распределения статистики Hχ2(k − 1) -распределением с k − 1 степенями свободы, т.е.нулевая гипотеза отклоняется, если H ≥ χ2
k−1,α.
При больших значениях n можно воспользоваться аппроксимациейИмана-Давенпорта.В соответстви с ней нулевая гипотеза сдвига отклоняется сдостоверностью α, если J ≥ Jα, где
J =H
2
(1 +
N − k
N − 1− H
)Jα =
{(k − 1)Fα(k − 1;N − k) + χ2
α(k − 1)}, χ2
α(k − 1)— критическоезначение статистики хи-квадрат, Fα(k − 1;N − k) — критическоезначение статистики Фишера с k − 1 и N − k степенями свободы.
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 43 / 44
Критерий Краскела-Уоллиса
Литература
Большев Л. Н., Смирнов Н. В.Таблицы математической статистики. —М.: Изд. Наука, 1983.
Тюрин Ю. Н., Макаров А. А.Статистический анализ опытных данныхна компьютере. — Под ред. В.Э. Фигурнова. М.: ИНФРА-М, 1998.
Холлендер М., Вулф Д.Непраметрические методы статистики. — М.:Финансы и статистика, 1983. — 518 с.
Greenwood P. E., Nikulin M. S.A Guide to Chi-Squared Testing. New York,John Wiley & Sons, Inc., 1996.
Крамер Г.Математические методы статистики. М.: Мир, 1975
Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 44 / 44