Каковы условия данных, на которые мы должны обратить внимание, когда p-значения не могут быть лучшим способом определения статистической значимости? Существуют ли конкретные типы проблем, которые попадают в эту категорию?
Каковы условия данных, на которые мы должны обратить внимание, когда p-значения не могут быть лучшим способом определения статистической значимости? Существуют ли конкретные типы проблем, которые попадают в эту категорию?
Ответы:
Вы спрашиваете об отбраковке данных , что и происходит при тестировании очень большого числа гипотез с набором данных или при проверке гипотез с набором данных, предложенных теми же данными.
В частности, проверьте множественные гипотезы опасности и проверки гипотезы, предложенные данными .
Решение состоит в том, чтобы использовать какую-то коррекцию для коэффициента ложного обнаружения или частоты ошибок Familywise , такую как метод Шеффе или (очень старая школа) коррекция Бонферрони .
В несколько меньшей степени это может помочь отфильтровать ваши открытия по доверительному интервалу для отношения шансов (ИЛИ) для каждого статистического результата. Если доверительный интервал 99% для отношения шансов равен 10-12, то ИЛИ <= 1 с некоторой чрезвычайно малой вероятностью, особенно если размер выборки также большой. Если вы обнаружите что-то подобное, это, вероятно, будет сильным эффектом, даже если он будет проверен миллионами гипотез.
Вы не должны рассматривать значение p вне контекста.
Одним из довольно простых моментов (как показано на примере xkcd ) является то, что вам необходимо учитывать, сколько тестов вы фактически делаете. Очевидно, вы не должны быть шокированы, увидев p <0,05 для одного из 20 тестов, даже если нулевая гипотеза верна каждый раз.
Более тонкий пример этого встречается в физике высоких энергий и известен как эффект поиска в другом месте . Чем больше пространство параметров, которое вы ищете для сигнала, который может представлять новую частицу, тем больше вероятность того, что вы увидите видимый сигнал, который действительно вызван случайными колебаниями.
Одна вещь, которую вы должны знать, это размер выборки, который вы используете. Очень большие выборки, такие как экономисты, использующие данные переписи, приведут к дефлированным значениям p. Эта статья «Слишком большая, чтобы обанкротиться: большие выборки и проблема p-значения» охватывает некоторые из проблем.