Когда я читаю книгу Вассермана «Вся статистика», я замечаю тонкую тонкость в определении p-значений, которую я не могу понять. Неформально Вассерманн определяет значение p как
[..] вероятность (ниже ) наблюдения значения тестовой статистики такая же или более экстремальная, чем на самом деле наблюдалось.
Акцент добавлен. То же самое более формально (теорема 10.12):
Предположим, что размер теста имеет вид
отклонить тогда и только тогда, когда .
Потом,
где - наблюдаемое значение . Если то
Кроме того, Вассерманн определяет p-значение теста Пирсона (и других тестов аналогично) как:
Часть, которую я хотел бы попросить прояснить, - это знак «больше-равно» ( ) в первом определении и знак «больше» ( ) во втором определении. Почему бы нам не написать , который бы соответствовал первой цитате « такой же как или более экстремальный?»
Это явное удобство, так что мы вычисляем значение p как ? Я заметил, что R также использует определение со знаком , например, в .chisq.test