В феврале 2016 года Американская статистическая ассоциация выпустила официальное заявление о статистической значимости и p-значениях. Наша ветка об этом подробно обсуждает эти вопросы. Однако до сих пор нет авторитета, который бы предлагал общепризнанную эффективную альтернативу. Американское статистическое общество (АСС) опубликовало свой ответ, p-значения: что дальше?
«Значение р не очень хорошо для многих».
Мы считаем, что ASA не зашел достаточно далеко. Настало время признать, что эра р-значений закончилась. Статистики успешно использовали их, чтобы сбить с толку студентов, обмануть ученых и дурачить редакторов повсюду, но мир начинает понимать эту хитрость. Мы должны отказаться от этой попытки начала XX века статистиками контролировать процесс принятия решений. Нам нужно вернуться к тому, что на самом деле работает.
Официальное предложение АСС таково:
Вместо p-значений ASS выступает за STOP (процедура SeaT-Of-Pants). Этот проверенный временем и проверенный метод использовался древними греками, людьми эпохи Возрождения и всеми учеными, пока не появился Рональд Фишер и не разрушил все. СТОП простой, прямой, управляемый данными и авторитетный. Для этого авторитетная фигура (предпочтительнее мужчина старшего возраста) просматривает данные и решает, согласны ли они с его мнением. Когда он решает, что они это делают, результат «значительный». В противном случае это не так, и все должны забыть обо всем этом.
принципы
Ответ обращается к каждому из шести принципов ASA.
STOP может указывать, насколько несовместимы данные с указанной статистической моделью.
Нам нравится эта фраза, потому что это такой причудливый способ сказать, что СТОП ответит на любой вопрос, да или нет. В отличие от p-значений или других статистических процедур, это не оставляет сомнений. Это идеальный ответ для тех, кто говорит: «Нам не нужна вонючая нулевая гипотеза! Что это за *?! @? Никто никогда не мог понять, каким он должен был быть ».
СТОП не измеряет вероятность того, что гипотеза верна: она на самом деле решает, верна она или нет.
Все смущены вероятностями. Убирая вероятность из картины, STOP устраняет необходимость в многолетнем обучении студентов и аспирантов. Теперь любой (кто достаточно взрослый и мужской) может выполнять статистический анализ без боли и мучений, слушая даже одну статистическую лекцию или запуская тайное программное обеспечение, которое издает непонятный результат.
Научные выводы и деловые или политические решения могут основываться на здравом смысле и реальных авторитетных фигурах.
В любом случае, важные решения всегда принимались властями, поэтому давайте просто признаем это и исключим посредников. Использование СТОП освободит статистиков для выполнения того, для чего они лучше всего подходят: использования чисел, чтобы скрыть правду, и освящения предпочтений тех, кто у власти.
Правильный вывод требует полной отчетности и прозрачности.
STOP - самая прозрачная и очевидная статистическая процедура, когда-либо изобретенная: вы смотрите на данные и принимаете решение. Это устраняет все эти запутанные z-тесты, t-тесты, тесты хи-квадрат и процедуры алфавитного супа (ANOVA! GLM! MLE!), Используемые людьми, чтобы скрыть тот факт, что они понятия не имеют, что означают данные.
СТОП измеряет важность результата.
Это самоочевидно: если человек, пользующийся полномочиями, использует СТОП, то результат должен быть важным.
Сам по себе СТОП является хорошим доказательством в отношении модели или гипотезы.
Мы бы не хотели бросать вызов авторитету, не так ли? Исследователи и лица, принимающие решения, признают, что СТОП предоставляет всю необходимую им информацию. По этим причинам анализ данных может закончиться ОСТАНОВКОЙ; нет необходимости в альтернативных подходах, таких как p-значения, машинное обучение или астрология.
Другие подходы
Некоторые статистики предпочитают так называемые «байесовские» методы, в которых неясная теорема, посмертно опубликованная священнослужителем 18-го века, применяется бездумно для решения каждой проблемы. Его наиболее известные сторонники свободно признают, что эти методы являются «субъективными». Если мы собираемся использовать субъективные методы, то, очевидно, чем более авторитетным и знающим является лицо, принимающее решения, тем лучше будет результат. Таким образом, STOP становится логическим пределом всех байесовских методов. Зачем работать над этими ужасными вычислениями и тратить столько компьютерного времени, когда вы можете просто показать данные ответственному человеку и спросить его, каково его мнение? Конец истории.
Недавно возникло еще одно сообщество, которое бросило вызов священникам статистиков. Они называют себя «обучающимися машинам» и «исследователями данных», но на самом деле они просто хакеры, ищущие более высокий статус. Официальная позиция АСС заключается в том, что эти парни должны сформировать свою профессиональную организацию, если они хотят, чтобы люди воспринимали их всерьез.
Вопрос
Является ли это ответом на проблемы, которые ASA идентифицировала с тестированием p-значений и нулевой гипотезы? Может ли это действительно объединить байесовскую и частую парадигмы (как это явно указано в ответе)?