Я немного покопался в архивах Cross Validated и, похоже, не нашел ответа на свой вопрос. Мой вопрос заключается в следующем: Википедия дает три предположения, которые необходимо придерживаться для теста рангов Вилкоксона (слегка измененного для моих вопросов):
Пусть Zi = Xi-Yi для i = 1, ..., n.
Различия Zi предполагаются независимыми.
(а.) Каждый Zi происходит из одной и той же непрерывной популяции, и (б.) каждый Zi симметричен относительно общей медианы;
Значения, которые представляют Xi и Yi, упорядочены ... поэтому сравнения «больше чем», «меньше чем» и «равно» полезны.
Однако документация для? Wilcox.test в R, похоже, указывает на то, что (2.b) на самом деле то, что проверено процедурой:
«... если и x, и y заданы, а спарено - ИСТИНА, выполняется проверка ранговых значений Вилкоксона с нулем, что распределение ... x - y (в случае двух спаренных примеров) симметрично относительно mu».
Для меня это звучит так, как будто тест проводится для нулевой гипотезы о том, что "Z распределен симметрично вокруг медианы mu = SomeMu", так что отклонение от нуля может быть либо отклонением симметрии, либо отклонением того, что мю, вокруг которого Z симметрична - SomeMu.
Это правильное понимание документации R для wilcox.test? Конечно, это важно по той причине, что я провожу ряд парных разностных тестов для некоторых данных до и после («X» и «Y» выше). Данные «до» и «после» по отдельности сильно искажены, но различия не так сильно искажены (хотя все же несколько искажены). Под этим я подразумеваю, что данные «до» или «после», рассматриваемые отдельно, имеют асимметрию ~ 7–21 (в зависимости от рассматриваемой выборки), в то время как данные «различий» имеют асимметрию ~ = 0,5–5. но не так сильно.
Если наличие асимметрии в моих данных «различий» приведет к тому, что тест Уилкоксона даст мне ложные / предвзятые результаты (как показывает статья в Википедии), тогда асимметрия может быть большой проблемой. Однако, если тесты Уилкоксона фактически проверяют, является ли распределение различий "симметричным вокруг mu = SomeMu" (как, по-видимому, указывает? Wilcox.test), то это не представляет особой проблемы.
Таким образом, мои вопросы:
Какая интерпретация выше верна? Не влияет ли асимметрия в моем распределении "различий" на мой тест Уилкоксона?
Если асимметрия вызывает беспокойство: «Насколько асимметрия вызывает беспокойство?»
Если подписанные ранговые тесты Уилкоксона кажутся здесь совершенно неуместными, какие-либо предложения по поводу того, что мне следует использовать?
Спасибо. Если у вас есть какие-либо дополнительные предложения о том, как я могу провести этот анализ, я буду очень рад их услышать (хотя я также могу открыть другую ветку для этой цели). Кроме того, это мой первый вопрос о перекрестной проверке; если у вас есть предложения / комментарии о том, как я задал этот вопрос, я тоже открыт для этого!
Немного предыстории: я анализирую набор данных, который содержит наблюдения о том, что я назову «ошибками в производстве». У меня есть наблюдение за ошибками, происходящими в производственном процессе до и после внезапной проверки, и одна из целей анализа состоит в том, чтобы ответить на вопрос: «Проверяет ли разница в выявленном количестве ошибок?»
Набор данных выглядит примерно так:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
Есть около 4000 наблюдений. Другими переменными являются катагорические наблюдения, которые описывают характеристики фирм. Размер может быть маленьким, средним или большим, и каждая фирма является одной и только одной из них. Фирмы могут быть любого или всех «типов».
Меня попросили провести несколько простых тестов, чтобы увидеть, были ли статистически значимые различия в наблюдаемой частоте ошибок до и после проверок для всех фирм и различных подгрупп (в зависимости от размера и типа). T-тесты вышли, потому что данные были сильно искажены как до, так и после, например, в R данные до выглядели примерно так:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(Они составлены - я боюсь, что не могу публиковать реальные данные или какие-либо фактические манипуляции с ними из-за проблем собственности / конфиденциальности - мои извинения!)
Парные различия были более централизованными, но все еще не очень хорошо соответствовали нормальному распределению - слишком пиковому. Различия данных выглядели примерно так:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
Было предложено, чтобы я использовал тест рангов со знаком Уилкоксона, и после краткого ознакомления с? Wilcox.test и Wikipedia, и здесь это похоже на использование теста. Учитывая вышеизложенные предположения, я считаю, что (1) хорошо, учитывая процесс генерирования данных. Предположение (2.a) не совсем верно для моих данных, но обсуждение здесь: Альтернатива тесту Уилкоксона, когда распределение не является непрерывным? казалось, указывало, что это не было слишком большой проблемой. Предположение (3) в порядке. Мое единственное беспокойство (я полагаю) - Предположение (2.b).
Еще одно замечание , сделанное несколько лет спустя: в конечном итоге я прошел отличный непараметрический курс статистики и потратил много времени на тесты с ранговыми суммами. В предположении (2.a) «Каждый Zi происходит из одной и той же непрерывной популяции» заложена идея, что обе выборки могут происходить из популяций с одинаковой дисперсией - это оказывается чрезвычайно важным, практически говоря. Если у вас есть опасения по поводу различий в ваших популяциях (из которых вы берете образцы), вы должны быть обеспокоены использованием WMW.