У нас уже есть несколько потоков, помеченных как p-значения, которые показывают много недоразумений о них. Десять месяцев назад мы имели нить о психологическом журнале , что «запрещено» -значения р , в настоящее время Американской статистической ассоциации (2016) говорит , что с нашим анализом мы «не должны заканчиваться с расчетом на -значение».
Американская статистическая ассоциация (ASA) считает, что научное сообщество могло бы извлечь пользу из официального заявления, разъясняющего несколько широко согласованных принципов, лежащих в основе правильного использования и интерпретации значения.
Комитет перечисляет другие подходы в качестве возможных альтернатив или дополнений к :
Ввиду распространенных злоупотреблений и неправильных представлений о некоторые статистики предпочитают дополнять или даже заменять другими подходами. К ним относятся методы, которые подчеркивают оценку по сравнению с тестированием, такие как доверительные интервалы, достоверность или интервалы прогнозирования; Байесовские методы; альтернативные меры доказательств, такие как отношения правдоподобия или байесовские факторы; и другие подходы, такие как теоретико-решающее моделирование и ложные скорости обнаружения Все эти меры и подходы основаны на дальнейших допущениях, но они могут более непосредственно учитывать размер эффекта (и связанную с ним неопределенность) или правильность гипотезы. р
Итак, давайте представим реальность после значений. ASA перечисляет некоторые методы, которые можно использовать вместо значений , но почему они лучше? Какой из них может быть реальной заменой исследователю, который использовал всю свою жизнь? Я полагаю , что такого рода вопросы будут появляться в пост- -значения реальности, так что, может быть , давайте стараться быть один шаг впереди них. Какова разумная альтернатива, которая может быть применена из коробки? Почему этот подход должен убедить вашего ведущего исследователя, редактора или читателей?р р р
Как следует из следующей записи в блоге , значения непревзойденны своей простотой:
Для р-значения требуется только статистическая модель поведения статистики при нулевой гипотезе. Даже если для выбора «хорошей» статистики используется модель альтернативной гипотезы (которая будет использоваться для построения p-значения), эта альтернативная модель не обязательно должна быть корректной, чтобы p-значение было действительным и полезно (то есть: ошибка контроля типа I на желаемом уровне, предлагая некоторую мощность для обнаружения реального эффекта). Напротив, другие (замечательные и полезные) статистические методы, такие как отношения правдоподобия, оценка размера эффекта, доверительные интервалы или байесовские методы, требуют, чтобы предполагаемые модели удерживались в более широком диапазоне ситуаций, а не только при проверенном нулевом значении.
Являются ли они или, может быть, это не так, и мы можем легко заменить их?
Я знаю, что это широко, но основной вопрос прост: что является лучшей (и почему) реальной альтернативой реальной жизни, которую можно использовать в качестве замены?
ASA (2016). ASA Заявление о статистической значимости и . Американский статистик. (в прессе)