Я читаю слайды Джона Крушке «Анализ байесовских данных» , но на самом деле у меня есть вопрос о его интерпретации t-тестов и / или всей основы тестирования значимости нулевой гипотезы. Он утверждает, что p-значения плохо определены, потому что они зависят от намерений следователя.
В частности, он приводит пример (страницы 3-6) двух лабораторий, которые собирают идентичные наборы данных, сравнивая две обработки. Одна лаборатория обязуется собирать данные от 12 субъектов (по 6 на условие), а другая собирает данные в течение фиксированного периода времени, что также дает 12 субъектов. Согласно слайдам, критическое значение для отличается между этими двумя схемами сбора данных: для первой, но для последней !р < 0,05 т крит = 2,33 т крит = 2,45
В блоге, который я сейчас не могу найти, предполагается, что сценарий с фиксированной продолжительностью имеет больше степеней свободы, поскольку они могли собирать данные от 11, 13 или любого другого числа субъектов, в то время как сценарий с фиксированным N - определение, имеет .
Может ли кто-нибудь, пожалуйста, объясните мне:
Почему критическое значение будет отличаться между этими условиями?
(Предполагая, что это проблема) Как можно было бы исправить или сравнить эффекты различных критериев остановки?
Я знаю, что установка критериев остановки на основе значимости (например, выборка до ) может повысить вероятность ошибки типа I, но здесь это не происходит, поскольку ни одно из правил остановки не зависит от результата Анализ.