Я пытаюсь выбрать один из этих двух тестов для анализа парных данных. Кто-нибудь знает эмпирические правила о том, какой из них выбрать в целом?
Я пытаюсь выбрать один из этих двух тестов для анализа парных данных. Кто-нибудь знает эмпирические правила о том, какой из них выбрать в целом?
Ответы:
Я пытаюсь выбрать один из этих двух тестов для анализа парных данных. Кто-нибудь знает эмпирические правила о том, какой из них выбрать в целом?
Тест со знаком ранга несет в себе предположение о симметрии различий под нулевым значением, которое в тесте знака не требуется. (Это предположение необходимо для того, чтобы перестановки знаков, прикрепленных к разряду без знака, были одинаково вероятны.)
С другой стороны, если в популяции существует почти симметрия, а хвост не очень тяжелый, знаковый ранг должен иметь большую силу.
[Это не должно восприниматься как совет выбирать между ними на основе выборки ; в общем, это приводит к тому, что свойства теста отличаются от номинальных (тесты могут быть смещены, фактические уровни значимости больше не являются такими, какими они кажутся, вычисленные значения p не представляют истинных значений p и т. д.). Вместо этого, где это возможно, характеристики должны оцениваться на основе знаний, внешних по отношению к образцу, к которому применяется тест - будь то по предметной области, знакомству с другими наборами данных, такими как этот, разделение выборки, ...]
В моем случае критерий суммы рангов имеет наибольшее значение p, критерий знака - средний, знак ранга - наименьший. Следовательно, он обладает большей силой.
Это не то, как вы решаете, что тест имеет большую мощность - более низкое значение p в отношении одной выборки может быть просто связано с капризами этой выборки, тогда как мощность зависит от поведения всех случайных выборок, взятых из одной и той же популяции.
Аналогичным образом мы могли бы рассчитать коэффициент отторжения для последовательности популяций с различным расположением * парных различий и получить полную кривую мощности. Тогда «более высокая мощность» будет соответствовать всей кривой мощности (или почти всей ее, отмечая, что оба должны быть на одном уровне значимости) для одного теста, лежащего над другим.
* Вы могли бы принять это как медиану для настоящего обсуждения - в то время как оценщик для теста рангов со знаком является медианой парных средних парных разностей, в предположении симметрии оценщик местоположения также должен быть подходящей оценкой медианной пары разница.
Вот связанный вопрос Как выбрать между t-тестом или непараметрическим тестом, например, Уилкоксоном в небольших выборках . Один из ответов включает (краткое) обсуждение данного вопроса.