Критерий манна уитни значимость. U критерий Манна-Уитни
U-критерий является ранговым , поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Другие названия: критерий Манна-Уитни-Уилкоксона (Mann-Whitney-Wilcoxon, MWW), критерий суммы рангов Уилкоксона (Wilcoxon rank-sum test) или критерий Уилкоксона-Манна-Уитни (Wilcoxon-Mann-Whitney test, WMW).
Примеры задач
Пример 1. Первая выборка - это пациенты, которых лечили препаратом А. Вторая выборка - пациенты, которых лечили препаратом Б. Значения в выборках - это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
Пример 2. Первая выборка - это поля, обработанные агротехническим методом А. Вторая выборка - поля, обработанные агротехническим методом Б. Значения в выборках - это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
Пример 3. Первая выборка - это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка - дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках - это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.
Описание критерия
Заданы две выборки .
Дополнительные предположения:
Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу равенства медиан в двух выборках. Существуют распределения, для которых гипотеза верна, но их медианы различны.
U-критерий можно применять для проверки гипотезы сдвига в качестве альтернативной , где - некоторая константа, отличная от нуля. При этой альтернативе U-критерий является состоятельным . Его целесообразно применять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой физической величины. При этом функция распределения описывает погрешности измерения одного значения, а - другого. Однако во многих приложениях (в частности, эконометрических) нет особых оснований предполагать, что распределение второй выборки лишь сдвигается, но не меняется каким-либо иным образом.
U-критерий является непараметрическим аналогом критерия Стьюдента . Если выборки нормальные , то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента.
История
Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном. В 1947 году он был существенно переработан и расширен Манном и Уитни, по именам которых сегодня обычно и называется.
Литература
- Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947, №18. - Pp. 50-60.
- Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. 1945. - Pp. 80–83.
- Орлов А. И. Эконометрика. - М.: Экзамен, 2003. - 576 с. (§4.5 Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?)
- Кобзарь А. И. Прикладная математическая статистика. - М.: Физматлит, 2006. - 816 с.
По уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.
Другие названия: критерий Манна - Уитни - Уилкоксона (англ. Mann - Whitney - Wilcoxon, MWW ), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test ) или критерий Уилкоксона - Манна - Уитни (англ. Wilcoxon - Mann - Whitney test ).
История
Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном (F. Wilcoxon ). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann ) и Д. Р. Уитни (D. R. Whitney ), по именам которых сегодня обычно и называется.
Описание критерия
Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума .
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.
Ограничения применимости критерия
- В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
- В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало.
Использование критерия
Для применения U-критерия Манна - Уитни нужно произвести следующие операции.
Автоматический расчет U-критерия Манна - Уитни
Таблица критических значений
См. также
- Критерий Краскела - Уоллиса - многомерное обобщение U-критерия Манна - Уитни.
Литература
- Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947. - № 18. - P. 50-60.
- Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. - 1945. - P. 80-83.
- Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. - Л., 1973.
- Сидоренко Е. В. Методы математической обработки в психологии. - С-Пб., 2002.
Wikimedia Foundation . 2010 .
Смотреть что такое "U-критерий Манна - Уитни" в других словарях:
критерий Манна Уитни - — Тематики электросвязь, основные понятия EN Mann Whitney U test … Справочник технического переводчика
U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия
U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия
U критерий Манна Уитни (англ. Mann Whitney U test) статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять… … Википедия
- (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми … Википедия
Или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия
Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому… … Википедия
Критерий Кохрена используют при сравнении трёх и более выборок одинакового объёма. Расхождение между дисперсиями считается случайным при выбранном уровне значимости, если: где квантиль случайной величины при числе суммируемых… … Википедия
- (максиминный критерий) один из критериев принятия решений в условиях неопределённости. Критерий крайнего пессимизма. История Критерий Вальда был предложен Абрахамом Вальдом в 1955 году для выборок равного объема, а затем распространен на … Википедия
Где T x - наибольшая сумма рангов, n x - наибольшая из объемов выборок n 1 и n 2 .
Назначение сервиса . С помощью данного онлайн-калькулятора производится расчет U критерия Манна-Уитни .
Назначение критерия
Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 , n 2 ≥ 3 или n 1 =2, n 2 ≥ 5. В каждой выборке должно быть не более 60 наблюдений.Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Положим, что первым рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а вторым рядом - тот, где они предположительно ниже.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.
Гипотезы
H 0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1: Уровень признака в группе 2 ниже уровня признака в группе 1.
Алгоритм расчета критерия Манна-Уитни
- Объединить все данные в единый ряд, пометив данные, принадлежащие разным выборкам.
- Проранжировать значения , приписывая меньшему значению меньший ранг. Всего рангов получится (n 1 + n 2).
- Подсчитать сумму рангов отдельно для каждой выборки.
- Определить большую из двух ранговых сумм.
- Определить значение U по формуле:
U = n 1 ·n 2 + n x ·(n x + 1)/2 – T x ,
где n 1 – объем выборки №1; n 2 – объем выборки №2; T x – большая из двух ранговых сумм; n x – объем максимальной выборки: n x = max(n 1 , n 2). - Определить критические значения U кр по таблице . Если U эмп > U кр (0,05). H 0 принимается. Если U эмп ≤ U кр (0,05) H 0 отвергается. Чем меньше значения U, тем достоверность различий выше.
Пример . У предполагаемых участников психологического эксперимента был измерен уровень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано две группы юношей в возрасте от 18 до 24 лет студентов физического факультета и психологического факультета. Показатели вербального интеллекта представлены в таблице. Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?
Ф | П |
135 | 130 |
130 | 129 |
131 | 121 |
128 | 129 |
127 | 119 |
137 | 124 |
126 | 125 |
137 | 129 |
131 | 129 |
137 | 130 |
137 | 131 |
127 | 123 |
133 | |
125 |
Сравнение результатов показывает, что значения выборки X несколько выше, чем выборки Y, поэтому первой считаем выборку X.
Таким образом, нам требуется определить, можно ли считать имеющуюся разницу между баллами существенной.
Решение .
Проранжируем представленную таблицу. При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой величины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких учеников ранг такого балла следует считать, как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания.
Так как в матрице имеются связанные ранги (одинаковый ранговый номер) 1-го ряда, произведем их переформирование. Переформирование рангов производиться без изменения важности ранга, то есть между ранговыми номерами должны сохраниться соответствующие соотношения (больше, меньше или равно). Также не рекомендуется ставить ранг выше 1 и ниже значения равного количеству параметров (в данном случае n = 26). Переформирование рангов производится в табл.
Номера мест в упорядоченном ряду | Расположение факторов по оценке эксперта | Новые ранги |
1 | 119 | 1 |
2 | 121 | 2 |
3 | 123 | 3 |
4 | 124 | 4 |
5 | 125 | 5.5 |
6 | 125 | 5.5 |
7 | 126 | 7 |
8 | 127 | 8.5 |
9 | 127 | 8.5 |
10 | 128 | 10 |
11 | 129 | 12.5 |
12 | 129 | 12.5 |
13 | 129 | 12.5 |
14 | 129 | 12.5 |
15 | 130 | 16 |
16 | 130 | 16 |
17 | 130 | 16 |
18 | 131 | 19 |
19 | 131 | 19 |
20 | 131 | 19 |
21 | 133 | 21 |
22 | 135 | 22 |
23 | 137 | 24.5 |
24 | 137 | 24.5 |
25 | 137 | 24.5 |
26 | 137 | 24.5 |
Используя предложенный принцип ранжирования, получим таблицу рангов.
X | Ранг X | Y | Ранг Y |
125 | 5.5 | 119 | 1 |
126 | 7 | 121 | 2 |
127 | 8.5 | 123 | 3 |
127 | 8.5 | 124 | 4 |
128 | 10 | 125 | 5.5 |
130 | 16 | 129 | 12.5 |
131 | 19 | 129 | 12.5 |
131 | 19 | 129 | 12.5 |
133 | 21 | 129 | 12.5 |
135 | 22 | 130 | 16 |
137 | 24.5 | 130 | 16 |
137 | 24.5 | 131 | 19 |
137 | 24.5 | ||
137 | 24.5 | ||
Сумма | 234.5 | Сумма | 116.5 |
Этих данных достаточно, чтобы воспользоваться формулой расчёта эмпирического значения критерия:
Гипотеза H 0 о незначительности различий между выборками принимается, если U кр < u эмп. В противном случае H 0 отвергается и различие определяется как существенное.
где U kp - критическая точка, которую находят по таблице Манна-Уитни.
Найдем критическую точку U kp
По таблице находим U kp (0.05) = 45
Так как U kp > u эмп - принимаем альтернативную гипотезу H 1 ; различия в уровнях выборок можно считать существенными.
По уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.
Другие названия: критерий Манна - Уитни - Уилкоксона (англ. Mann - Whitney - Wilcoxon, MWW ), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test ) или критерий Уилкоксона - Манна - Уитни (англ. Wilcoxon - Mann - Whitney test ). Реже: критерий числа инверсий .
Энциклопедичный YouTube
1 / 3
✪ U-критерий МАННА-УИТНИ | АНАЛИЗ ДАННЫХ #8
✪ U-критерий МАННА-УИТНИ в STATISTICA #03 | СТАТИСТИКА STATISTICA
✪ U критерий Манна Уитни
Субтитры
История
Данный метод выявления различий между выборками был предложен в 1945 году Фрэнком Уилкоксоном (F. Wilcoxon ). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann ) и Д. Р. Уитни (D. R. Whitney ), по именам которых сегодня обычно и называется.
Описание критерия
Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума .
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.
Ограничения применимости критерия
- В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
- В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало (до 10).
Использование критерия
Для применения U-критерия Манна - Уитни нужно произвести следующие операции.
- Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг. Общее количество рангов получится равным: N = n 1 + n 2 , {\displaystyle N=n_{1}+n_{2},} где - количество элементов в первой выборке, а - количество элементов во второй выборке.
- Разделить единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно - на долю элементов второй выборки. Определить большую из двух ранговых сумм ( T x {\displaystyle T_{x}} ), соответствующую выборке с n x {\displaystyle n_{x}} элементами.
- Определить значение U-критерия Манна - Уитни по формуле: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . {\displaystyle U=n_{1}\cdot n_{2}+{\frac {n_{x}\cdot (n_{x}+1)}{2}}-T_{x}.}
- По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n 1 {\displaystyle n_{1}} и n 2 {\displaystyle n_{2}} . Если полученное значение U {\displaystyle U} меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U {\displaystyle U} больше табличного, принимается
Критерий U Манна - Уитни
Назначение критерия. Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда п 1, п 2 > 3 или п Л = 2, п 2 > 5, и является более мощным, чем критерий Q Розенбаума.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок. Эмпирическое значение критерия и отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше t/ 3Mn , тем более вероятно, что различия достоверны.
Гипотезы.
Уровень невербального интеллекта в группе студентов физиков выше, чем в группе студентов-психологов.
Графическое представление критерия U. Па рис. 7.25 представлены три из множества возможных вариантов соотношения двух рядов значений.
В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются. Область наложения (S j) слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними достоверны. Точно определить это мы сможем с помощью критерия U.
В варианте (б) второй ряд тоже ниже первого, но и область перекрещивающихся значений у двух рядов достаточно обширна (5 2). Она может еще не достигать критической величины, когда различия придется признать несущественными. Но так ли это, можно определить только путем точного подсчета критерия U.
В варианте (в) второй ряд ниже первого, но область наложения настолько обширна (5 3), что различия между рядами скрадываются.
Рис. 7.25.
в двух выборках
Примечание. Перекрытием (5 t , S 2 , *$з) обозначены зоны возможного наложения. Ограничения критерия U.
- 1. В каждой выборке должно быть не менее трех наблюдений: n v п 2 > 3; допускается, чтобы в одной выборке было два наблюдения, но тогда во второй их должно быть не менее 5.
- 2. В каждой выборке должно быть не более 60 наблюдений; п л, п 2 щ, п 2 > 20 ранжирование становится достаточно трудоемким.
Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q Розенбаума было с высоким уровнем значимости определено, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в таблице.
2 ниже уровня признака в выборке 1 на достоверно значимом уровне. Чем меньше значения U, тем достоверность различий выше.
Теперь проделаем всю эту работу на материале нашего примера. В результате работы по 1-6 шагам алгоритма построим таблицу (табл. 7.4).
Таблица 7.4
Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов
Студенты-физики (п = 14) |
Студенты-психологи (п= 12) |
||
Показатель невербального интеллекта |
|||
Средние 107,2 |
Общая сумма рангов: 165 + 186 = 351. Расчетная сумма по формуле (5.1) такова:
Равенство реальной и расчетной сумм соблюдено. Мы видим, что по уровню невербального интеллекта более «высоким» рядом окалывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186. Теперь мы готовы сформулировать статистические гипотезы:
Я 0: группа студентов-психологов не превосходит группу студентов- физиков по уровню невербального интеллекта;
Я,: группа студентов-психологов превосходит группу студентов-физи- ков по уровню невербального интеллекта.
В соответствии со следующим шагом алгоритма определяем эмпирическую величину U :
Поскольку в нашем случае п л * п 2 , подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу (7.4) соответствующее ей п х.:
По приложению 8 определяем критические значения для п л = 14, п 2 = 12:
Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если {/ эмп U Kp 0 05 (при ^эмп = 60, и шп > U Kf) о,05).
Следовательно, Н 0 принимается следующей: группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.
Обратим внимание на то, что для данного случая Q-критерий Розенбаума неприменим, так как размах вариативности в группе физиков шире, чем в группе психологов: и самое высокое, и самое низкое значения невербального интеллекта приходятся на группу физиков (см. табл. 7.4).