Разница между тестом суммы рангов Уилкоксона и тестом ранговых знаков Уилкоксона


22

Мне было интересно, какова теоретическая разница между тестом Уилкоксона Ранка-Суммы и тестом Уилкоксона Знакового ранга с использованием парных наблюдений. Я знаю, что критерий суммы рангов Уилкоксона допускает различное количество наблюдений в двух разных выборках, в то время как критерий знакового ранга для парных выборок этого не позволяет, однако, по моему мнению, оба теста одинаковы. Может ли кто-нибудь дать мне дополнительную справочную / теоретическую информацию, когда нужно использовать тест Ранкса-суммы Уилкоксона и когда нужно использовать тест со знаком Ранкса Уилкоксона, используя парные наблюдения?

Ответы:


25

Вы должны использовать подписанный тест ранга, когда данные сопряжены .

Вы найдете много определений спаривания, но в глубине души критерием является то, что делает пары значений как минимум несколько положительно зависимыми, в то время как непарные значения не являются зависимыми. Часто спаривание зависимостей происходит потому, что это наблюдения на одной и той же единице (повторные измерения), но это не обязательно должно быть на одной и той же единице, просто в некотором роде, как правило, связанное (при измерении одного и того же вида вещей) , чтобы считаться «парным».

Вы должны использовать критерий суммы ранга, когда данные не спарены.

Это в основном все, что нужно сделать.

Обратите внимание, что наличие одного и того же не означает, что данные являются парными, а наличие другого nNN не означает, что пары не существует (возможно, несколько пар потеряли наблюдение по какой-то причине). Спаривание происходит из рассмотрения того, что было выбрано.

Эффект использования парного теста, когда данные являются парными, заключается в том, что он обычно дает больше возможностей для обнаружения интересующих вас изменений. Если связь приводит к сильной зависимости *, тогда выигрыш в мощности может быть существенным.

* в частности, но если говорить несколько свободно, если величина эффекта велика по сравнению с типичным размером парных различий, но мала по сравнению с типичным размером непарных различий, вы можете подобрать разницу с помощью парного теста в довольно маленький размер выборки, но с непарным тестом только при гораздо большем размере выборки.

Однако, когда данные не сопряжены, может быть (по крайней мере, немного) контрпродуктивно рассматривать данные как сопряженные. Тем не менее, стоимость - в случае потери мощности - может во многих случаях быть довольно небольшой - исследование мощности, которое я провел в ответ на этот вопрос, по-видимому, предполагает, что в среднем потери мощности в типичных ситуациях малой выборки (скажем, для n порядка от 10 до 30 в каждом образце после поправки на различия в уровне значимости) может быть удивительно небольшим.

[Если вы почему-то действительно не уверены, являются ли данные парными или нет, потери при обработке непарных данных как парных обычно относительно незначительны, в то время как выгоды могут быть существенными, если они спарены. Это говорит о том, что если вы действительно не знаете, и у вас есть способ выяснить, что связано с тем, что предполагается, что они были связаны - например, значения находятся в одной строке таблицы, на практике может иметь смысл действовать как если бы данные были спарены, чтобы быть в безопасности - хотя некоторые люди могут проявлять излишнюю физическую нагрузку из-за того, что вы делаете это.]


7

Я не исследователь, я статистик. Сначала я размечу требования для теста суммы подписанных рангов Уилкоксона (WSRST).

  • WSRST требует, чтобы популяции были в паре, например, одну и ту же группу людей тестировали два разных случая или вещи и измеряли их воздействие, а затем мы сравнивали эти две вещи или случаи.
  • WSRST требует, чтобы данные были количественными. Количественные данные - это данные, измеряемые по шкале, поэтому я выделил мир, измеренный в первой точке. Если участников попросят оценить их ответы, вы будете иметь дело с качественными данными, где вам придется использовать тест знака для проверки вашей гипотезы.

[Существуют и другие требования к WSRST, но перечисленных мною достаточно для различия двух тестов]

Теперь тест суммы рангов Уилкоксона (WRST)

  • Основное требование заключается в том, чтобы образцы брались из независимых групп населения. Например, вы можете проверить, сложнее ли экзаменационная работа 1, чем экзаменационная работа 2, и для этого у вас будет две группы студентов, и эти группы не обязательно должны быть одинакового размера. Из примера две группы независимы: если вы попросили одну и ту же группу написать одну и ту же статью дважды, то вы будете использовать WSRST для проверки своей гипотезы.
  • Другое требование состоит в том, что данные не должны быть количественными, то есть вы также можете выполнить тест на качественных данных.
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.