Уместность Wilcoxon подписал ранговый тест


11

Я немного покопался в архивах Cross Validated и, похоже, не нашел ответа на свой вопрос. Мой вопрос заключается в следующем: Википедия дает три предположения, которые необходимо придерживаться для теста рангов Вилкоксона (слегка измененного для моих вопросов):

Пусть Zi = Xi-Yi для i = 1, ..., n.

  1. Различия Zi предполагаются независимыми.

  2. (а.) Каждый Zi происходит из одной и той же непрерывной популяции, и (б.) каждый Zi симметричен относительно общей медианы;

  3. Значения, которые представляют Xi и Yi, упорядочены ... поэтому сравнения «больше чем», «меньше чем» и «равно» полезны.

Однако документация для? Wilcox.test в R, похоже, указывает на то, что (2.b) на самом деле то, что проверено процедурой:

«... если и x, и y заданы, а спарено - ИСТИНА, выполняется проверка ранговых значений Вилкоксона с нулем, что распределение ... x - y (в случае двух спаренных примеров) симметрично относительно mu».

Для меня это звучит так, как будто тест проводится для нулевой гипотезы о том, что "Z распределен симметрично вокруг медианы mu = SomeMu", так что отклонение от нуля может быть либо отклонением симметрии, либо отклонением того, что мю, вокруг которого Z симметрична - SomeMu.

Это правильное понимание документации R для wilcox.test? Конечно, это важно по той причине, что я провожу ряд парных разностных тестов для некоторых данных до и после («X» и «Y» выше). Данные «до» и «после» по отдельности сильно искажены, но различия не так сильно искажены (хотя все же несколько искажены). Под этим я подразумеваю, что данные «до» или «после», рассматриваемые отдельно, имеют асимметрию ~ 7–21 (в зависимости от рассматриваемой выборки), в то время как данные «различий» имеют асимметрию ~ = 0,5–5. но не так сильно.

Если наличие асимметрии в моих данных «различий» приведет к тому, что тест Уилкоксона даст мне ложные / предвзятые результаты (как показывает статья в Википедии), тогда асимметрия может быть большой проблемой. Однако, если тесты Уилкоксона фактически проверяют, является ли распределение различий "симметричным вокруг mu = SomeMu" (как, по-видимому, указывает? Wilcox.test), то это не представляет особой проблемы.

Таким образом, мои вопросы:

  1. Какая интерпретация выше верна? Не влияет ли асимметрия в моем распределении "различий" на мой тест Уилкоксона?

  2. Если асимметрия вызывает беспокойство: «Насколько асимметрия вызывает беспокойство?»

  3. Если подписанные ранговые тесты Уилкоксона кажутся здесь совершенно неуместными, какие-либо предложения по поводу того, что мне следует использовать?

Спасибо. Если у вас есть какие-либо дополнительные предложения о том, как я могу провести этот анализ, я буду очень рад их услышать (хотя я также могу открыть другую ветку для этой цели). Кроме того, это мой первый вопрос о перекрестной проверке; если у вас есть предложения / комментарии о том, как я задал этот вопрос, я тоже открыт для этого!


Немного предыстории: я анализирую набор данных, который содержит наблюдения о том, что я назову «ошибками в производстве». У меня есть наблюдение за ошибками, происходящими в производственном процессе до и после внезапной проверки, и одна из целей анализа состоит в том, чтобы ответить на вопрос: «Проверяет ли разница в выявленном количестве ошибок?»

Набор данных выглядит примерно так:

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

Есть около 4000 наблюдений. Другими переменными являются катагорические наблюдения, которые описывают характеристики фирм. Размер может быть маленьким, средним или большим, и каждая фирма является одной и только одной из них. Фирмы могут быть любого или всех «типов».

Меня попросили провести несколько простых тестов, чтобы увидеть, были ли статистически значимые различия в наблюдаемой частоте ошибок до и после проверок для всех фирм и различных подгрупп (в зависимости от размера и типа). T-тесты вышли, потому что данные были сильно искажены как до, так и после, например, в R данные до выглядели примерно так:

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(Они составлены - я боюсь, что не могу публиковать реальные данные или какие-либо фактические манипуляции с ними из-за проблем собственности / конфиденциальности - мои извинения!)

Парные различия были более централизованными, но все еще не очень хорошо соответствовали нормальному распределению - слишком пиковому. Различия данных выглядели примерно так:

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

Было предложено, чтобы я использовал тест рангов со знаком Уилкоксона, и после краткого ознакомления с? Wilcox.test и Wikipedia, и здесь это похоже на использование теста. Учитывая вышеизложенные предположения, я считаю, что (1) хорошо, учитывая процесс генерирования данных. Предположение (2.a) не совсем верно для моих данных, но обсуждение здесь: Альтернатива тесту Уилкоксона, когда распределение не является непрерывным? казалось, указывало, что это не было слишком большой проблемой. Предположение (3) в порядке. Мое единственное беспокойство (я полагаю) - Предположение (2.b).

Еще одно замечание , сделанное несколько лет спустя: в конечном итоге я прошел отличный непараметрический курс статистики и потратил много времени на тесты с ранговыми суммами. В предположении (2.a) «Каждый Zi происходит из одной и той же непрерывной популяции» заложена идея, что обе выборки могут происходить из популяций с одинаковой дисперсией - это оказывается чрезвычайно важным, практически говоря. Если у вас есть опасения по поводу различий в ваших популяциях (из которых вы берете образцы), вы должны быть обеспокоены использованием WMW.


Спасибо за два ответа! Они оба одинаково помогли мне. Я бы «выбрал оба», если бы мог. Майк подтолкнул меня к некоторому теоретическому пониманию, которое было очень полезно в концептуальном плане, хотя Анико чуть более прямо отвечало на мой первоначальный вопрос. Спасибо вам обоим!
CompEcon

Ответы:


8

Википедия ввела вас в заблуждение, заявив, что "... если заданы оба значения x и y, а парные значения - ИСТИНА, ранговый критерий Уилкоксона с нулевым признаком того, что распределение ... x - y (в случае двух спаренных примеров) симметрично о му выполняется ".

Тест определяет, являются ли значения RANK-TRANSFORMED для симметричными относительно медианы, указанной вами в нулевой гипотезе (я предполагаю, что вы будете использовать ноль). Асимметрия не является проблемой, поскольку тест со знаком ранга, как и большинство непараметрических тестов, является «бесплатным при распространении». Ценой, которую вы платите за эти тесты, часто является снижение энергопотребления, но, похоже, у вас достаточно большой образец, чтобы преодолеть это.zi=xiyi

Альтернативой «что, черт возьми», альтернативой критерию суммы рангов может быть попытка простого преобразования, такого как и при вероятности того, что эти измерения могут приблизительно следовать логнормальному распределению - так что значения должны выглядеть "криво колокол". Тогда вы могли бы использовать на тесте и убедить себя (и своего босса, который только взял Business Stats), что тест ранга суммы работает. Если это работает, есть бонус: t-критерий средних значений для логнормальных данных - это сравнение медиан для исходных, не преобразованных измерений.ln(xi)ln(yi)

Мне? Я бы сделал и то, и другое, что смогу приготовить (проверка отношения правдоподобия по Пуассону по размеру фирмы?). Проверка гипотез - все о том, чтобы определить, являются ли доказательства убедительными, и некоторые люди берут кучу убедительности.


Ах, это имеет большой смысл. Особенно сейчас, когда я вернулся домой и вытащил свой старый учебник по DeGroot & Schervish, в котором есть хорошее описание того, что на самом деле делают эти знаковые тесты. Фантастика. И спасибо за общие мысли о проверке гипотез :) Мне нравится перспектива. Небольшое замечание: часть, которую вы отмечаете как вводящую в заблуждение, на самом деле принадлежит R, из документации для wilcox.test. Это немного беспокоит меня ...
CompEcon

9

И Википедия, и страница справки R в некотором роде верны и пытаются сформулировать одно и то же, они просто формулируют это по-разному.

В статье Википедии высказываются гипотезы как (медиана = 0) против (медиана! = 0), и говорится, что вы можете сделать вывод из теста, если различия имеют симметричное распределение (+ другие предположения).

Страница справки R более конкретна, она содержит гипотезы (медиана = 0 и различия имеют симметричное распределение) против (по крайней мере, одна из них является ложной). Так что это перевело предположение в нулевую гипотезу. Я думаю, что они сделали это, чтобы подчеркнуть необходимость симметричности: при искаженных различиях критерий со знаком будет отвергать нулевую гипотезу, даже если медиана не работает. Если вы читаете учебник, он также может сказать вам, что проверяется нулевая гипотеза P (X> Y) = 0,5 - остальное фактически просто следует из этого.

С точки зрения применения, вопрос, конечно, заключается в том, заботишься ли ты конкретно о медиане (и тогда асимметрия - это проблема, а медианный тест - возможная альтернатива), или о том, заботишься ли ты обо всем распределении, а затем P (X> y)! = 0.5 свидетельствует об изменениях.


1
Хорошо, это имеет смысл. Спасибо за вклад! Я заметил, что на странице Википедии для медианного теста написано, что непарный тест Манна-Уитни-U предпочтителен. Это сразу заставляет меня думать, что я как бы вернулся к тому, с чего начал, думая, что парный тест Уилкоксона каким-то образом использует больше информации. Возможно, что я действительно пытаюсь обдумать, так это то, что вы имеете в виду, когда говорите «заботитесь конкретно о медиане ... или обо всем распределении». Я забочусь о полном распределении, но характеризую его по медиане ..
CompEcon
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.