Тесты эквивалентности для ненормальных данных?


9

У меня есть некоторые данные, которые я не могу предположить извлечь из нормальных распределений, и я хотел бы провести тесты эквивалентности между группами. Для обычных данных существуют такие методы, как TOST (два односторонних t-теста). Есть ли что-нибудь аналогичное TOST для ненормальных данных?


1
Я не знаком с TOST, но вы ищете Манн-Уитни? Это непараметрический тест (в том смысле, что не делаются предположения о распределениях), который может предоставить доказательства того, что две группы происходят из разных распределений.
Ник Сэбб

1
Я ищу тест, в котором нулевая гипотеза состоит в том, что есть разница, а альтернативная гипотеза заключается в том, что (почти) нет никакой разницы.
Райан Томпсон

Для небольших выборок вы можете посмотреть ответы в stats.stackexchange.com/questions/49782/… . Для больших выборок классический подход с t-тестами хорош благодаря центральной предельной теореме.
Майкл М

3
Ничто в фразе «Два односторонних теста» - ни основополагающая логика не подразумевают нормальную теорию. Должно быть вполне возможно адаптировать его к альтернативе смещения местоположения с ненормальным распределением. Но будьте осторожны - во многих случаях с ненормальными данными вам действительно нужен тест эквивалентности со сдвигом масштаба , а с другими видами данных - что-то другое. Знание того, что необходимо, действительно зависит от того, что вы измеряете и какую проблему вы решаете. Вместо того, чтобы пытаться втиснуть ваш колышек в круглое отверстие, стоит изучить колышек.
Glen_b

Ответы:


8

Логика TOST, используемая для статистики t и z тестов типа Вальда (т.е. θ/sθ и θ/σθ соответственно), может быть применена к аппроксимациям z для непараметрических тестов, таких как тесты по знаку, рангу знака и сумме рангов. Для простоты я предполагаю, что эквивалентность выражается симметрично с одним термином, но расширить мой ответ на асимметричные термины эквивалентности просто.

При этом возникает одна проблема: если человек привык выражать член эквивалентности (скажем, Δ ) в тех же единицах, что и θ , то член эквивалентности должен быть выражен в единицах конкретного знака, ранга со знаком или ранга сумма статистика, которая является как заумной, и в зависимости от N .

Однако можно также выразить термины эквивалентности TOST в единицах самой статистики теста. Считаем, что в TOST, если Zзнак равноθ/σθ , то Z1знак равно(Δ-θ)/σθ и Z2знак равно(θ+Δ)/σθ . Если мы примем εзнак равноΔ/σθ , то Z1знак равноε-Z и Z2знак равноZ+ε . (Статистические данные, представленные здесь, оцениваются вправомхвосте:п1знак равноп(Z>Z1) ип2знак равноп(Z>Z2) .) Использование единицраспределенияzдля определения порога эквивалентности / релевантности может быть предпочтительным для непараметрических тестов, поскольку альтернатива определяет порог в единицах знаковых рангов или ранговых сумм, который может быть практически бессмысленным для исследователей и трудным для интерпретации.

Если мы признаем, что (для симметричных интервалов эквивалентности) невозможно отвергнуть любую нулевую гипотезу TOST, когда εZ1-α , то мы можем приступить к принятию решений относительно соответствующего размера члена эквивалентности соответственно. Например, εзнак равноZ1-α+0,5 .

Этот подход был реализован с опциями для исправления непрерывности и т. Д. В пакете tost для Stata (который теперь включает в себя конкретные реализации TOST для тестов Shapiro-Wilk и Shapiro-Francia), к которым вы можете получить доступ, набрав в Stata:

Изменить: Почему логика TOST является здравым, и тестовые схемы эквивалентности были применены к сводным тестам, я был убежден, что мое решение было основано на глубоком непонимании приблизительной статистики для тестов Шапиро-Вилка и Шапиро-Франсии


3

Это не TOST как таковой, но тест Комолгорова-Смирнова позволяет проверить значимость разницы между распределением выборки и вторым эталонным распределением, которое вы можете указать. Вы можете использовать этот тест, чтобы исключить конкретный тип другого распределения, но не других распределений в целом (по крайней мере, не без учета увеличения ошибок в тестах всех возможных альтернатив ... если это как-то возможно само). Альтернативная гипотеза для любого одного теста, как обычно, останется менее конкретной гипотезой «всеохватывающего».

Если вы можете согласиться с тестом распределительных различий между двумя группами, где нулевая гипотеза состоит в том, что две группы распределены одинаково, вы можете использовать тест Комолгорова-Смирнова для сравнения распределения одной группы с распределением другой группы. Вероятно, это обычный подход: игнорировать различия, если они не являются статистически значимыми, и обосновать это решение тестовой статистикой.

В любом случае, вы можете рассмотреть некоторые более глубокие вопросы, возникающие из подхода «все или ничего» к отклонению нулевой гипотезы. Одна из таких проблем очень популярна здесь, на Cross Validated: « Является ли тестирование нормальности« по существу бесполезным »? » Люди любят отвечать на вопросы о тестировании нормальности с вопросом: «Почему вы хотите это проверить?» Предполагается, что намерение, как правило, состоит в том, чтобы аннулировать причину тестирования, что в конечном итоге может привести в правильном направлении. Суть полезных ответов на вопрос, который я здесь связал, выглядит следующим образом:

  1. Если вы обеспокоены нарушениями параметрических тестовых допущений, вам следует просто найти непараметрический тест, который не делает вместо этого допущения о распределении. Не проверяйте, нужно ли вам использовать непараметрический критерий; просто используйте это!
  2. Вам следует заменить вопрос «Является ли мой дистрибутив значительно ненормальным?» с "Насколько ненормально мое распределение, и как это может повлиять на мой анализ интереса?" Например, тесты, касающиеся центральной тенденции (особенно вовлекающие средства), могут быть более чувствительными к асимметрии, чем к эксцессу, и наоборот, для тестов относительно (со) дисперсии. Тем не менее, существуют надежные альтернативы для большинства аналитических целей, которые не очень чувствительны к любому из видов ненормальности.

Если вы все еще хотите пройти тест на эквивалентность, вот еще одна популярная дискуссия о перекрестной проверке, которая включает тестирование на эквивалентность.


1
0:|θ-θ0|Δ01-:θ-θ0Δ01-:θ-θ0-Δ01-02--Δ<θ-θ0<Δ[-Δ,Δ]

Справедливо; Я, наверное, немного вводил в заблуждение. Я удалил части, против которых вы, кажется, возражаете. Тем не менее, я думаю, что вы сформулировали свой комментарий слишком сильно. Несмотря на то , что вынужденный дихотомичный fail to/ rejectподход хорошо налаженные, большинство образцов не могут полностью исключить возможность того , что нулевой верно. Почти всегда есть некоторый шанс ложной ошибки отклонения, если кто-то настаивает на отклонении, что обычно не является буквально необходимым. Это было, вероятно, более важным моментом, который я намеревался сделать изначально. Надеюсь, теперь это будет немного яснее без удаленных вещей
Ник Стаунер

2
Ну, на мой взгляд, тесты на прочность эквивалентности (например, H0-0+0+0-0+0-Δ0+0-0+0-

Конечно, вопросы чувствительности и специфичности, PPV и NPV не уходят.
Алексис

-1

H0:fxfyH1:fx=fyH0fxN(0,1)f^xf^yX=YfyfИкс

H0H1

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

дает

> mean(p)
[1] 0.034

п

С другой стороны, если мы возьмем:

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  x <- x + 0.4*g
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

дает:

> mean(p)
[1] 0.437

Как и в случае с NHST, существуют тонкие проблемы мощности и ложноположительных ошибок, которые следует изучить при моделировании, прежде чем делать окончательные выводы.

Я думаю, что схожий (возможно, более общий метод) использует байесовскую статистику для сравнения апостериорной оценки любой вероятностной модели.


2
AdamO вы, кажется, смешиваете «тестирование равенства» с «тестированием эквивалентности». В методах и применении последних существует давняя и солидная литература.
Алексис

1
См., Например, Wellek, S. (2010). Проверка статистических гипотез эквивалентности и неполноценности . Чепмен и Холл / CRC Press, второе издание.
Алексис

@ Алексис Хм, к сожалению, у нас нет доступа к библиотеке. Вы говорите, что эквивалентность - это то же самое, что и неполноценность, поскольку оценки, лежащие в пределах допустимых значений, считаются эквивалентными?
AdamO

1
Не совсем: не неполноценность - это односторонний тест того, выполняет ли новое лечение не хуже, чем какой-либо стандарт, минус наименьшее существенное различие, которое указано априори . Тесты на эквивалентность - это тесты нулевой гипотезы о том, что две (или более) величины различаются - в любом направлении - более чем на наименьшую значимую разницу, указанную априори . Некоторые оригинальные документы:
Алексис

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.