Я знаю, что есть много материалов, объясняющих р-значение. Однако эту концепцию нелегко понять без дальнейшего разъяснения.
Вот определение p-значения из Википедии:
Значение p - это вероятность получения тестовой статистики, по крайней мере, такой же экстремальной, как и та, которая фактически наблюдалась, при условии, что нулевая гипотеза верна. ( http://en.wikipedia.org/wiki/P-value )
Мой первый вопрос касается выражения «по крайней мере, такого же крайнего, как тот, который действительно наблюдался». Мое понимание логики, лежащей в основе использования p-значения, заключается в следующем: если p-значение мало, маловероятно, что наблюдение произошло в предположении нулевой гипотезы, и нам может потребоваться альтернативная гипотеза для объяснения наблюдения. Если значение p не так мало, вероятно, что наблюдение происходило только в предположении нулевой гипотезы, и альтернативная гипотеза не обязательна для объяснения наблюдения. Поэтому, если кто-то хочет настоять на гипотезе, он / она должен показать, что значение p нулевой гипотезы очень мало. Имея это в виду, мое понимание неоднозначного выражения состоит в том, что p-значение равно, если PDF статистики является унимодальным, где - тестовая статистика, а x - ее значение, полученное из наблюдения. Это правильно? Если это правильно, все еще применимо ли использование бимодального PDF статистики? Если два пика PDF хорошо разделены и наблюдаемое значение находится где-то в области низкой плотности вероятности между двумя пиками, то в каком интервале р-значение дает вероятность?х
Второй вопрос о другом определении р-значения от Wolfram MathWorld:
Вероятность того, что вариация будет принимать значение, большее или равное наблюдаемому значению, строго случайно. ( http://mathworld.wolfram.com/P-Value.html )
Я понял, что фразу «строго случайно» следует интерпретировать как «принятие нулевой гипотезы». Это правильно?
Третий вопрос касается использования «нулевой гипотезы». Давайте предположим, что кто-то хочет настаивать на том, что монета справедлива. Он высказывает гипотезу, что относительная частота голов составляет 0,5. Тогда нулевая гипотеза «относительная частота головок не 0,5». В этом случае, хотя вычисление p-значения нулевой гипотезы затруднительно, вычисление легко для альтернативной гипотезы. Конечно, проблему можно решить, поменяв роль двух гипотез. Мой вопрос заключается в том, что отклонение или принятие, основанное непосредственно на p-значении исходной альтернативной гипотезы (без введения нулевой гипотезы), заключается в том, в порядке ли это или нет. Если это не так, то как обычно обходить такие трудности при расчете p-значения нулевой гипотезы?
Я разместил новый вопрос, который более ясен на основе обсуждения в этой теме.