В какой ситуации тест Уилкоксона со знаком будет предпочтительнее, чем критерий Стьюдента или Тест на знак?


10

После некоторого обсуждения (ниже) у меня теперь есть более четкая картина сфокусированного вопроса, так что здесь есть пересмотренный вопрос, хотя некоторые комментарии теперь могут показаться не связанными с первоначальным вопросом.

Кажется, что t-тесты быстро сходятся для симметричных распределений , что тест со знаком ранга предполагает симметрию , и что для симметричного распределения нет разницы между средними / псевдомедианцами / медианами. Если да, то при каких обстоятельствах сравнительно неопытный статистик сочтет полезным тест со знаком ранга, когда у него есть и t-критерий, и критерий знака? Если один из моих студентов (например, по общественным наукам) пытается проверить, работает ли одно лечение лучше, чем другое (с помощью некоторой относительно легко интерпретируемой меры, например, некоторого понятия «средней» разницы), я пытаюсь найти место для подписанного. ранговый тест, хотя его, кажется, обычно преподают, а знак теста игнорируют в моем университете.


1
Justme: конечно, я не думал об этом.
JonB

1
Это зависит от того , на чью обычную мудрость вы смотрите; мой опыт этого очень отличается от вашего. Конечно, легко найти ресурсы, в которых четко указано, что симметрия разностных оценок предполагается равной нулю (и что это имеет значение). Но обратите внимание, что это под нулевым значением - в результате, обнаружение отсутствия симметрии в показателях различий в выборке не обязательно имеет значение - вам не нужно иметь симметрию под альтернативой. Если вы абсолютно уверены, что если бы значение NULL было истинным, симметрия сохранялась бы - и во многих случаях это весьма правдоподобное предположение - ... ctd
Glen_b -Возвратите Монику

1
ctd ... тогда нет проблем. Проблема в том, что если вы не готовы принять это заранее, вы не знаете, было ли отклонение вызвано ошибкой предположения; очевидное, что нужно сделать, это просто не допустить этого.
Glen_b

2
Сначала посмотрим на ваш второй комментарий: (поверх того, что вы уже упоминали), обратите внимание, что 1. нормальные предположения не исчерпывают параметрические тесты. 2. Тест со знаком ранга на самом деле является не тестом медиан, а статистикой / псевдомедианами Ходжеса-Лемана с одной выборкой (хотя, если вы добавите допущение симметрии к альтернативе, он также проверит медианы и, где существуют средства также для средств, среди многих других вещей). Точно так же критерий суммы рангов является тестом не медиан, а медианных парных различий. Вы правы, что уровень теста со знаком может быть очень чувствительным к асимметрии.
Glen_b

2
В вашем предыдущем комментарии: 1 Симметрия обычно не рассматривается как часть нулевого значения, но как часть предположений, которые вам необходимы для того, чтобы перестановки были взаимозаменяемыми при нулевом значении. 2. как уже упоминалось ранее, это на самом деле не проверка медиан, а псевдомедиан, и это справедливо даже при асимметричной альтернативе. Это правда, что интерпретация иногда проще, если вы делаете некоторые ограничительные предположения, но ограничения, необходимые для того, чтобы сделать ее разумным тестом для медиан, не должны быть такими строгими, как допущение симметрии в альтернативе.
Glen_b

Ответы:


3

Рассмотрим распределение парных различий, которое несколько тяжелее хвостового, чем обычно, но не особенно «пиковое»; тогда часто подписанный критерий ранга будет иметь тенденцию быть более мощным, чем критерий Стьюдента, но также более мощным, чем критерий знака.

Например, при логистическом распределении относительная асимптотическая эффективность теста рангов со знаком относительно t-теста составляет 1,097, поэтому тест рангов со знаком должен быть более мощным, чем t (по крайней мере, в больших выборках), но асимптотическая относительная эффективность критерия знака относительно критерия Стьюдента составляет 0,822, поэтому критерий знака будет менее мощным, чем критерий С (опять же, по крайней мере, в больших выборках).

По мере того, как мы переходим к распределениям с более тяжелыми хвостами (хотя по-прежнему избегаем чрезмерно пиковых), t будет стремиться работать относительно хуже, в то время как тест знака должен несколько улучшиться, и знак, и знак ранга будут превосходить t при обнаружении небольших эффекты с существенным запасом (т. е. для определения эффекта потребуется гораздо меньший размер выборки). Будет большой класс дистрибутивов, для которых тест со знаком ранга является лучшим из трех.

Вот один пример - распределение . Мощность была смоделирована при n = 100 для трех тестов, для уровня значимости 5%. Сила для теста отмечена черным, а для знака Вилкоксона - красным, а для теста - зеленым. Доступные уровни значимости в знаковом тесте не включали особенно 5%, поэтому в этом случае был использован рандомизированный тест, чтобы приблизиться к правильному уровню значимости. Ось X является параметром который представляет сдвиг от нулевого случая (все тесты были двусторонними, поэтому кривая фактической мощности была бы симметричной относительно 0). t δt3tδ

График кривых мощности для t, ранговых и знаковых тестов Уилкоксона с n = 100 и уровнем значимости 5% для t3

Как мы видим из графика, тест со знаком ранга имеет большую мощность, чем тест знака, который, в свою очередь, имеет большую мощность, чем критерий Стьюдента.


Большое спасибо за это @Glen_b! Я все еще изо всех сил пытаюсь понять, где это вписывается в нашу учебную программу, когда у нас есть ученики, для которых даже концепция власти выходит за рамки их обучения, и почему мы учим Уилкоксона как основную альтернативу парному т. Но это дает некоторые полезные мотивы. Спасибо!
Justme

Между прочим, после рассмотрения того, какая особенность распределения влияет на асимптотическую дисперсию медианы (и, следовательно, мощность критерия знака), мне пришел пример, когда относительные положения критерия t и знака меняются местами; в результате я думаю, что есть хорошая возможность построить случай, когда подписанный тест ранга может быть значительно лучше, чем любой из двух других тестов. Я поиграю с этим еще немного, когда смогу и, возможно, напишу что-нибудь об этом.
Glen_b

Что касается вашей учебной программы, то ясно, что есть определенные случаи, когда знаковый ранг превосходит оба других теста (как я обрисовал в своих ответах - распределения, которые несколько тяжелее, чем обычно, но не особенно достигли пика); t лучше у нормального или более легкого, а тест знака лучше, когда распределение имеет сильный пик (который часто имеет тенденцию сочетаться с очень тяжелыми хвостами, но не должен). [Осторожно, однако, путайте эти идеи с простыми изменениями в распространении, которые не изменяют их относительные свойства.] ... Я уверен, что вы могли бы втиснуть несколько таких предложений в
Glen_b -Reinstate Monica

Большое спасибо @Glen_b! Проблема в том, что я не преподаю учебный план, просто поддерживаю его! Похоже, что учебная программа в большинстве отделов такова: (i) использовать проверку гипотезы нормальности (убей меня сейчас) и основываясь на этом (ii) либо использовать критерий Уилкоксона, либо критерий Стьюдента. Таким образом, более тонкие детали плеч распределения и т. Д. Никогда даже не затрагиваются, равно как и сила, только то, соответствуют ли предположения (в некотором смысле мусор). Но ваши мысли очень полезны для меня лично, по крайней мере!
Justme

Отличный пост @Glen_b! Итак, с точки зрения выбора из двух тестов, могу ли я сделать вывод, что мы всегда должны сначала вычислять мощность? Вместо того, чтобы следовать предположению, что всегда используется Sign Test, если распределение различий не является нормальным? Спасибо!
Lumos
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.