| Статистика+ | Библиотека |
| Орлов А.И. Какие
гипотезы можно проверять с помощью двухвыборочного критерия
Вилкоксона? – Журнал «Заводская лаборатория». 1999. Т.65. No.1.
С.51-55. Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона? А.И.Орлов[1] Установлено, что двухвыборочный критерий Вилкоксона (Манна-Уитни) предназначен для проверки гипотезы H0 : P(X < Y) = 1/2, где X - случайная величина, распределенная как элементы первой выборки, а Y - второй. Разобраны три примера. В прикладной математической статистике часто рассматривают
вероятностную модель двух независимых выборок числовых результатов
наблюдений. Первая выборка описывается набором m случайных величин X1,
X2, ... , Xm, имеющих одну и ту же функцию
распределения F(x), а вторая выборка - набором n случайных величин Y1,
Y2, ... , Yn, имеющих одну и ту же функцию
распределения G(x), причем все эти m+n случайных величин X1,
X2, ... , Xm, Y1, Y2,
... , Yn независимы в совокупности. Без ограничения
общности можно считать, что m # n, в противном случае
выборки можно поменять местами. Обычно предполагается,
что функции F(x) и G(x) непрерывны и строго возрастают. Из
непрерывности этих функций следует, что с вероятностью 1 все m+n
результатов наблюдений различны. В реальных статистических данных
иногда встречаются совпадения, но сам факт их наличия -
свидетельство нарушений предпосылок только что описанной базовой
математической модели.
Введем также
Тогда математические ожидания и дисперсии статистик Вилкоксона и Манна-Уитни согласно [1, с.160] выражаются через введенные величины:
Когда объемы обеих выборок безгранично растут, распределения статистик Вилкоксона и Манна-Уитни являются асимптотически нормальными (см., например, [1, гл.5 и 6]) с параметрами, задаваемыми формулами (1) .
Если выборки полностью однородны, т.е. их функции распределения
совпадают, справедлива гипотеза
H0: то L(t) = t и a= 1/2.
Подставляя в формулы (1), получаем, что Следовательно, распределение нормированной и центрированной статистики Вилкоксона Из асимптотической нормальности статистики Т следует, что правило принятия решения для критерия Вилкоксона выглядит так: - если
|T| <
- если же |T| >
В прикладной статистике наиболее часто применяется уровень
значимости
α=0,05. Тогда значение модуля статистики Т Вилкоксона
надо сравнивать с граничным значением
Правила принятия решений и таблица критических значений для критерия Вилкоксона строятся в предположении справедливости гипотезы полной однородности, описываемой формулой (2). А что будет, если эта гипотеза неверна? Другими словами, какова мощность критерия Вилкоксона?
Пусть объемы выборок достаточно велики, так что можно
пользоваться асимптотической нормальностью статистики Вилкоксона.
Тогда в соответствии с формулами (1) статистика T будет
асимптотически нормальна с параметрами Из формул (5) видно большое значение гипотезы H01: a = P(X < Y) = 1/2 . (6)
Если эта гипотеза неверна, то, поскольку m < n,
справедлива оценка
Следовательно, вероятность отклонения гипотезы H01 , когда
она неверна, т.е. мощность критерия Вилкоксона как критерия проверки
гипотезы (6), стремится к 1 при возрастании объемов выборок, т.е.
критерий Вилкоксона является состоятельным для этой гипотезы при
альтернативеАH01: Если же гипотеза (6) верна, то статистика T асимптотически
нормальна с математическим ожиданием 0 и дисперсией, определяемой
формулой Гипотеза (6) является сложной, дисперсия (9), как показывают приводимые ниже примеры, в зависимости от значений b2 и g2 может быть как больше 1, так и меньше 1, но согласно неравенству (7) никогда не превосходит 12.
Приведем пример двух функций распределения F(x) и G(x) таких,
что гипотеза (6) выполнена, а гипотеза (2) - нет. Поскольку Это условие выполняется, если функция (G(x) - (x + 1)/2 ) является нечетной. Пример 1.
Условие (11)
выполнено, поскольку функция (G(x) - (x + 1)/2 ) является нечетной.
Следовательно, a = 1/2 . Начнем с вычисления
В правой части последнего равенства стоят табличные интегралы [4, с.71].
Проведя соответствующие вычисления, получаем, что в правой части
стоит 1/8 ( - 4/ p2) = - 1/(2 p2).
Следовательно, для рассматриваемых функций распределения
нормированная и центрированная статистика Вилкоксона (см. формулу
(4)) асимптотически нормальна с математическим ожиданием 0 и
дисперсией (см. формулу (9)) Как легко видеть, дисперсия всегда меньше 1. Это значит, что в рассматриваемом случае гипотеза полной однородности (2) при проверке с помощью критерия Вилкоксона будет приниматься чаще, чем если она на самом деле верна. На наш взгляд, это означает, что критерий Вилкоксона нельзя считать критерием для проверки гипотезы (2) при альтернативе общего вида. Он не всегда позволяет проверить однородность - не при всех альтернативах. Точно так же критерии типа хи-квадрат нельзя считать критериями проверки гипотез согласия и однородности - они позволяют обнаружить не все различия, поскольку некоторые "скрадывает" группировка. Обсудим теперь, действительно ли критерий Вилкоксона нацелен на проверку равенства медиан распределений, соответствующих выборкам. Пример 2.
Построим
семейство пар функций распределения F(x) и G(x) таких, что их
медианы различны, но для F(x) и G(x) выполнена гипотеза (6). Очевидно, что медиана F(x) равна l, а медиана G(x) равна 1/2 .
Согласно соотношению (9) для выполнения гипотезы (6) достаточно
определить d как функцию l , d = d ( l ) , из условия
∫F(x)
dx = 1/2 . Итак, построено искомое семейство пар функций распределения. Пример 3. Пусть, как и в примере 2, распределения сосредоточены на интервале (0 ; 1), и на нем F(x) = x , а G(x) - функция распределения, сосредоточенного в двух точках - b и 1, т.е. G(x) = 0 при x, не превосходящем b ; G(x) = h на (b ; 1] ; G(x) = 1 при x > 1. С такой функцией G(x) легко проводить расчеты. Однако она не удовлетворяет принятым выше условиям непрерывности и строгого возрастания. Вместе с тем легко видеть, что она является предельной (сходимость в каждой точке отрезка [0 ; 1] ) для последовательности функций распределения, удовлетворяющих этим условиям, а распределение статистики Вилкоксона для пары функций распределения примера 3 является предельным для последовательности соответствующих распределений статистики Вилкоксона, полученных в рассматриваемых условиях непрерывности и строгого возрастания.
Условие P(X < Y) = 1/2 выполнено, если h = (1 - b)-1
/ 2 (при b из отрезка [0 ; 1/2] ). Поскольку h > 1/2 при
положительном b, то очевидно, что медиана G(x) равна b, в то время
как медиана F(x) равна 1/2 . Значит, при b = 1/2 медианы совпадают,
при всех иных положительных b - различны.
Легко подсчитать, что в условиях примера 3
Проанализируем величину D(T) в зависимости от параметра b и
объемов выборок m и n. При достаточно больших m и n Первый из описанных выше случаев имеет быть при b < b0 , при этом минимум D(T) возрастает от 0 (при b=0, w=1 - предельный случай) до 3(21/2 - 1) (при b=b0 , w - любом), а максимум уменьшается от 3 (при b=0, w=0 - предельный случай) до 3 (21/2 - 1) (при b=b0 , w - любом). Второй случай относится к b из интервала (b0 ; 1/2]. При этом минимум убывает от приведенного выше значения для b=b0 до 0 (при b=1/2 , w=0 - предельный случай) , а максимум возрастает от того же значения при b=b0 до 3 (при b=1/2 , w=0). Таким образом, D(T) может принимать все значения из интервала (0 ; 3) в зависимости от значений b и w. Если D(T) < 1, то при применении критерия Вилкоксона к выборкам с рассматриваемыми функциями распределения гипотеза однородности (2) будет приниматься чаще (при соответствующих значениях b и w - с вероятностью, сколь угодно близкой к 1), чем если бы она самом деле была верна. Если 1<D(T)<3, то гипотеза (2) также принимается достаточно часто. Так, если уровень значимости критерия Вилкоксона равен 0,05, то (асимптотическая) критическая область этого критерия имеет вид {T: U T U $ 1,96}. Если - самый плохой случай - D(T)=3, то гипотеза (2) принимается с вероятностью 0,7422.
При проверке гипотезы однородности мы рассмотрели различные
виды нулевых и альтернативных гипотез - гипотезу (2) и ее отрицание
в качестве альтернативы, гипотезу (6) и ее отрицание, гипотезы о
равенстве или различии медиан. В теоретических работах по
математической статистике любят гипотезу сдвига, в которой
альтернативой гипотезе (2) является гипотеза H1: Почему же математики так любят гипотезу сдвига (12)? Да потому, что она дает возможность доказывать глубокие математические результаты, например, об асимптотической оптимальности критериев, как это продемонстрировано в монографии Я.Ю.Никитина [7]. К сожалению, с точки зрения прикладной статистики это напоминает поиск ключей под фонарем, где светло, а не там, где они потеряны. Впрочем, новые методы обычно сначала разрабатываются в лаборатории и только потом переносятся на производство. Отметим еще одно обстоятельство. Часто говорят (в соответствии с классическим подходом математической статистики), что нельзя проверять нулевые гипотезы без рассмотрения альтернативных. Однако при практическом анализе данных зачастую полностью ясна формулировка той гипотезы, которую желательно проверить (например, гипотезы полной однородности - см. формулу (2)), в то время как формулировка альтернативной гипотезы не очевидна (то ли это гипотеза о неверности равенства (2) хотя бы для одного значения x, то ли это альтернатива (8), то ли - альтернатива сдвига (12), и т.д.). В таких случаях целесообразно "обернуть" задачу - исходя из статистического критерия найти альтернативы, относительно которых он состоятелен. Именно это и проделано в настоящей статье для критерия Вилкоксона. Литература
[1] Межвузовский центр экономического образования Минобразования РФ (при МГИЭМ), Москва, Россия |
|
©Алексей Симачёв,2001-2005. |