Это дискуссионный вопрос о пересечении статистики и других наук. Я часто сталкиваюсь с одной и той же проблемой: исследователи в моей области, как правило, говорят, что нет никакого эффекта, когда значение p не меньше уровня значимости. В начале я часто отвечал, что это не то, как работает проверка гипотез. Учитывая, как часто возникает этот вопрос, я хотел бы обсудить этот вопрос с более опытными статистиками.
Давайте рассмотрим недавнюю статью в научном журнале «Лучшая издательская группа» Nature Communications Biology (есть несколько примеров, но давайте сосредоточимся на одном)
Исследователи интерпретируют не статистически значимый результат следующим образом:
Таким образом, хроническое умеренное ограничение калорий может продлить продолжительность жизни и улучшить здоровье приматов, но это влияет на целостность серого вещества мозга, не влияя на когнитивные функции .
Доказательство:
Однако показатели в задании лабиринта Барнса не отличались между контрольными животными и животными с ограниченной калорийностью (LME: F = 0,05, p = 0,82; рис. 2a). Аналогичным образом, задача самопроизвольного чередования не выявила никакой разницы между контрольными животными и животными с ограниченной калорийностью (LME: F = 1,63, p = 0,22; рис. 2b).
Авторы также предлагают объяснение отсутствия эффекта - но ключевым моментом является не объяснение, а само утверждение. Приведенные графики выглядят для меня значительно «на глаз» (рисунок 2).
Более того, авторы игнорируют предшествующие знания:
вредные эффекты ограничения калорий на когнитивные функции были зарегистрированы для крыс и церебральных и эмоциональных функций у людей
Я могу понять то же утверждение для огромных размеров выборки (без эффекта = практически без существенного эффекта), но в конкретной ситуации использовались сложные тесты, и для меня не очевидно, как выполнять вычисления мощности.
Вопросов:
Я пропустил какие-либо детали, которые делают их выводы обоснованными?
Принимая во внимание необходимость сообщать о отрицательных результатах в науке, как доказать, что это не «отсутствие результата» (что мы имеем с ), а «отрицательный результат (например, нет разницы между группами)» используя статистику? Я понимаю, что для огромных размеров выборки даже небольшие отклонения от нуля вызывают отклонение, но давайте предположим, что у нас есть идеальные данные, и нам все еще нужно доказать, что нулевое значение является практически истинным.
Должны ли статистики всегда настаивать на математически правильных выводах, таких как «имея эту власть, мы не смогли обнаружить эффект значительного размера»? Исследователи из других областей сильно не любят такие формулировки отрицательных результатов.
Я был бы рад услышать любые мысли о проблеме, и я прочитал и понял связанные вопросы на этом веб-сайте. Существует четкий ответ на вопросы 2) -3) с точки зрения статистики, но я хотел бы понять, как следует отвечать на эти вопросы в случае междисциплинарного диалога.
UPD: я думаю, что хорошим примером отрицательного результата является 1-й этап медицинских испытаний, безопасность. Когда ученые смогут решить, что препарат безопасен? Я предполагаю, что они сравнивают две группы и делают статистику по этим данным. Есть ли способ сказать, что этот препарат безопасен? Кокрейн использует точное «никаких побочных эффектов не обнаружено», но врачи говорят, что этот препарат безопасен. Когда соблюдается баланс между точностью и простотой описания, и мы можем сказать, что «нет никаких последствий для здоровья»?