Я читал о , коэффициентах ошибок типа 1, уровнях значимости, расчетах мощности, размерах эффектов и дебатах Фишера против Неймана-Пирсона. Это заставило меня чувствовать себя немного ошеломленным. Я прошу прощения за стену текста, но я чувствовал, что необходимо дать обзор моего текущего понимания этих концепций, прежде чем я перейду к своим актуальным вопросам.
Из того, что я понял, значение - это просто мера неожиданности, вероятность получения результата, по крайней мере, экстремального, учитывая, что нулевая гипотеза верна. Первоначально Фишер намеревался сделать это непрерывной мерой.
В структуре Неймана-Пирсона вы заранее выбираете уровень значимости и используете его как (произвольную) точку отсечения. Уровень значимости равен частоте ошибок типа 1. Он определяется длительной частотой, то есть, если вы будете повторять эксперимент 1000 раз, и нулевая гипотеза верна, около 50 из этих экспериментов приведут к значительному эффекту из-за изменчивости выборки. Выбирая уровень значимости, мы защищаем себя от ложных срабатываний с определенной вероятностью. традиционно не фигурируют в этих рамках.
Если мы находим значение 0,01, это не означает, что коэффициент ошибок типа 1 равен 0,01, ошибка типа 1 устанавливается априори. Я полагаю, что это один из главных аргументов в дебатах Фишера против NP, потому что p- значения часто сообщаются как 0,05 *, 0,01 **, 0,001 ***. Это может ввести в заблуждение людей, говоря, что эффект является значительным при определенном значении p , а не при определенном значении значимости.
Я также понимаю, что значение является функцией размера выборки. Поэтому его нельзя использовать как абсолютное измерение. Небольшое p- значение может указывать на небольшой, не относящийся к делу эффект в эксперименте с большой выборкой. Чтобы противостоять этому, важно выполнить расчет мощности / эффекта при определении размера выборки для вашего эксперимента. P-значения говорят нам, есть ли эффект, а не насколько он велик. См Салливан 2012 .
Мой вопрос: как я могу примирить факты о том, что значение является мерой неожиданности (меньше = более убедительно), и в то же время его нельзя рассматривать как абсолютное измерение?
Что меня смущает, так это следующее: можем ли мы быть более уверенными в маленьком значении, чем в большом? В фишерском смысле я бы сказал, да, мы более удивлены. В рамках НП, выбор меньшего уровня значимости означал бы, что мы сильнее защищаемся от ложных срабатываний.
Но с другой стороны, значения зависят от размера выборки. Они не являются абсолютной мерой. Таким образом, мы не можем просто сказать, что 0,001593 более значимо, чем 0,0439. И все же это то, что подразумевается в рамках Фишера: мы были бы более удивлены такой экстремальной ценности. Существует даже дискуссия о том, что термин « очень значительный» является неправильным: неправильно ли называть результаты «очень значительными»?
Я слышал, что в некоторых областях науки считаются важными только тогда, когда они меньше 0,0001, тогда как в других областях значения около 0,01 уже считаются очень значимыми.
Смежные вопросы: