Можем ли мы принять ноль в тестах неуязвимости?


11

В обычном t-тесте средних значений, используя обычные методы проверки гипотез, мы либо отклоняем нулевое значение, либо не принимаем отрицательное нулевое, но никогда не принимаем нулевое. Одна из причин этого заключается в том, что если бы мы получили больше доказательств, тот же размер эффекта стал бы значительным.

Но что происходит в тесте неполноценности?

Это:

ЧАС0:μ1-μ0Икс

против

ЧАС1:μ1-μ0>Икс

где - это некоторое количество, которое мы считаем практически одинаковым. Итак, если мы отклоняем нуль, мы говорим, что больше, чем , по крайней мере, на . Мы не можем отклонить ноль, если нет достаточных доказательств. μ 1 μ 0 xИксμ1μ0Икс

Если величина эффекта равна Икс или больше, то это аналогично обычному t-критерию. Но что, если размер эффекта меньше, чем Икс в нашей выборке? Тогда, если бы мы увеличили размер выборки и сохранили тот же эффект, он остался бы незначительным. Можем ли мы, следовательно, принять ноль в этом случае?


1
Ваши гипотезы перепутаны? Обычно для теста NI нулевая гипотеза состоит в том, что разница больше, чем x, в то время как альтернатива состоит в том, что она меньше или равна x. Я думаю, это зависит от порядка вашей разницы шкалы.
Бьорн

Привет @ Björn, это будет зависеть от того, чем выше, тем хуже или выше, тем лучше.
Питер Флом

1
Это то же самое, что спросить, можно ли принять ноль в односторонних тестах? Это было обсуждено в комментариях к stats.stackexchange.com/a/85914 .
амеба

2
@amoeba Я думаю, что Питер представляет захватывающий аргумент (+1), возможно, более похожий на парадокс. Одно из общепринятых объяснений того, почему мы не «принимаем H0», которое иногда слышат, звучит так: «Если бы мы получили больше доказательств, тот же размер эффекта стал бы значительным». Но, следуя этой логике, как это делает Петр, мы либо приходим к выводу, что в некоторых ситуациях нам следует «принять H0», либо, если мы этого не сделаем, «причина» на самом деле неверна, а не то, почему мы делаем это вообще. Я считаю , что вы правы , - его аргумент будет применяться к односторонне т-тестов тоже, так как размер негативный эффект остается незначительным увеличением п
серебрянки

1
Да, я согласен: связанный ответ не отвечает на ваш вопрос. Я предоставил ссылку только потому, что в комментариях была соответствующая дискуссия.
амеба

Ответы:


7

Ваша логика точно так же применяется к старым добрым односторонним тестам (то есть с ), которые могут быть более знакомы читателям. Для конкретности представьте, что мы проверяем нулевое значение H 0 : μ 0 против альтернативы положительному μ . Тогда, если истинное значение µ отрицательно, увеличение размера выборки не приведет к значительному результату, т. Е. Если использовать ваши слова, неверно, что «если бы мы получили больше доказательств, тот же размер эффекта стал бы значительным».Иксзнак равно0ЧАС0:μ0μμ

Если мы проверим , у нас может быть три возможных результата:ЧАС0:μ0

  1. Во-первых, доверительный интервал может быть полностью выше нуля; тогда мы отклоняем нуль и принимаем альтернативу (то, что μ положительно).(1-α)100%μ

  2. Во-вторых, доверительный интервал может быть полностью ниже нуля. В этом случае мы не отвергаем ноль. Однако в этом случае я думаю, что было бы хорошо сказать, что мы «принимаем ноль», потому что мы могли бы рассматривать как другой нуль и отклонить его.ЧАС1

  3. В-третьих, доверительный интервал может содержать ноль. Тогда мы не можем отклонить и не можем также отклонить H 1 , так что нечего принимать.ЧАС0ЧАС1

Поэтому я бы сказал, что в односторонних ситуациях можно принять ноль, да. Но мы не можем принять это просто потому, что мы не смогли отказаться от него; Есть три варианта, а не два.

(Точно то же самое относится к тестам эквивалентности, таким как «два односторонних теста» (TOST), тестам неполноценности и т. Д. Можно отклонить ноль, принять ноль или получить неокончательный результат.)

Напротив, когда является нулевой точкой, такой как H 0 : μ = 0 , мы никогда не сможем принять ее, потому что H 1 : μ 0 не является допустимой нулевой гипотезой.ЧАС0ЧАС0:μзнак равно0ЧАС1:μ0

(Если не может иметь только дискретные значения, например , должно быть целым числом, то кажется , что мы могли бы принять H 0 : μ = 0 , так как H 1 : μ Z , μ 0 теперь делает составляют действительную нулевую гипотезу Это немного. особого случая, хотя.)μЧАС0:μзнак равно0ЧАС1:μZ,μ0


Эта проблема обсуждалась некоторое время назад в комментариях к ответу @ gung здесь: почему статистики говорят, что незначительный результат означает «вы не можете отклонить ноль», а не принимаете нулевую гипотезу?

См. Также интересную (и недооцененную) ветку. Означает ли неудача отклонить нуль в подходе Неймана-Пирсона, что нужно «принять» его? где @Scortchi объясняет, что в структуре Неймана-Пирсона некоторые авторы без проблем говорят о «принятии нуля». Это также то, что @Alexis означает в последнем абзаце ее ответа здесь.


Если доверительный интервал полностью выше нуля, отклоните нулевое значение µ 0 : это тест с наихудшим размером α(1-α)μ0 . Если(1-α)доверительный интервал полностью ниже нуля, отклоните ноль, чтоμ>0: это тест с наихудшим размеромαα2(1-α)μ>0 . Комбинируя два теста, вы можете поддерживать наихудший размерαα2 потому что два нуля являются взаимоисключающими. Таким образом, эти три результата могут быть описаны с точки зрения принятия одной альтернативы или другой альтернативы, или отклонения ни нулевого. α2
Scortchi - Восстановить Монику

Двусторонний тест можно рассматривать аналогично как составленный из двух односторонних тестов; но альтернативы не являются взаимоисключающими, и размер наихудшего случая равен (когда μ = 0 ). αμ=0
Scortchi - Восстановить Монику

Спасибо @ Scortchi. Почему-то я не совсем уверен, согласны ли вы или не согласны с моим ответом.
амеба

Поскольку не принимаются условие нуля в одном тесте, но ква альтернативы другой, я чувствую «принять нулевой» является неоправданно запутанной здесь; тем не менее ваша процедура должна удовлетворить тех, кто хочет. Что, возможно, заслуживает большего внимания в вашем ответе, так это разница между комбинированием тестов на неполноценность и неполноценность и наоборот , и тестами на превосходство против не превосходства (или ноль-ноль) и неполноценности против не-неполноценности (или ноль-ноль) , μ0
Scortchi - Восстановить Монику

@Scortchi Синтаксис вашего последнего предложения довольно сложен: что именно можно (или нельзя) комбинировать и в чем именно разница? Я не уверен, что правильно вас понял, извините.
амеба

6

Мы никогда не «принимаем нулевую гипотезу» (не принимая во внимание также силу и минимальный соответствующий размер эффекта). С помощью одного теста гипотез мы представляем естественное состояние, , а затем отвечаем на некоторую вариацию вопроса "насколько маловероятно, чтобы мы наблюдали данные, лежащие в основе нашей тестовой статистики, предполагая, что H 0 (и наше предположение о распределении) верно ?» Затем мы отклоним или не сможем отклонить нашу H 0 на основе предпочтительного уровня ошибок типа I и сделаем вывод, который всегда касается H A … то есть мы нашли доказательства для вывода H A , или мы не нашли доказательств для вывода H . Мы не принимаем HЧАС0ЧАС0ЧАС0ЧАСAЧАСAЧАСA потому что мы не искали доказательств этого. Отсутствие доказательств (например, различий) - это не то же самое, что доказательство отсутствия (например, различий). ,ЧАС0

Это верно для односторонних тестов, так же как и для двусторонних тестов: мы только ищем доказательства в пользу и находим их, либо не находим их.ЧАСA

ЧАС0ЧАС0ЧАСAЧАС0+ЧАС0-

Мне кажется, что нет никаких причин, по которым вы не можете объединить вывод из одностороннего теста на неполноценность с односторонним тестом на неполноценность, чтобы предоставить доказательства (или отсутствие доказательств) в обоих направлениях одновременно.

ЧАС0δЧАС0


1
Вопрос Питера содержал особенно интересное замечание, что этот ответ, кажется, обходит вокруг: одно из общепринятых объяснений стандартной терминологии «не отвергнуть Н0» состоит в том, что, например, в t-тесте, если мы получили больше доказательств, тот же эффект размер станет значительным. Но если бы это была «реальная» причина, по которой мы «не смогли отказаться», его аргумент о том, что мы могли «принять H0» в обстоятельствах, которые он обрисовал, кажется (по крайней мере мне) сильным, хотя я не уверен, что видел, что это было сделано не случайно, как своего рода статистический сленг, а не сознательно и сознательно.
Серебряная

1
Этот ответ вновь подтверждает традиционную позицию «принятия Н0» хорошим, ясным и лаконичным способом, но, похоже, не затрагивает непосредственно аргумент (или, возможно, парадокс) в основе вопроса Питера. Что вы думаете о «мы не можем принять H0, потому что, если бы у нас было больше доказательств, тот же размер эффекта стал бы значительным», аргумент для традиционной терминологии - есть ли какой-то недостаток в представлении Питера или его расширении, или была логика исходного аргумента недействительным в первую очередь?
Серебряная

1
@Silverfish перейдите по ссылке в моем ответе на «тесты релевантности», чтобы еще больше усилить мое критическое разрешение вопроса «мы не можем принять H0, потому что, если у нас будет больше доказательств, тот же самый эффект будет иметь большое значение»
Алексис

1
@Alexis Я должен согласиться с Silverfish. Я ценю ваш ответ, но он не затрагивает мою центральную точку, по той причине, что Silverfish провозгласил. Если бы у нас было N = 1 000 000, то практически любая разница была бы значительной в стандартных настройках. Но в случае с неполноценностью это не так. И даже в TOST двусторонний, это не так. Если разница меньше суммы, которую мы считаем важной, то никакое N не заставит ее вздохнуть.
Питер Флом

1
Извинения - мой 1-й комментарий был задуман как прелюдия к 2-му (или, точнее, 2-й был переполнением 1-го!) И не был призван поднять отдельную точку. Ссылка была полезной, спасибо. Ваш центральный момент (который вы очень хорошо изложили как в своем ответе, так и в своем изложении) ясно объясняет, почему вы не согласны с выводом Питера . Но мне было любопытно, где вы чувствовали недостаток в его логике - или, возможно, его предпосылку . Это то, что мне показалось, что не было решено напрямую.
Серебряная
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.