Тонкость р-значения: больше-равно против больше

11

Когда я читаю книгу Вассермана «Вся статистика», я замечаю тонкую тонкость в определении p-значений, которую я не могу понять. Неформально Вассерманн определяет значение p как

[..] вероятность (ниже $H_0$ ) наблюдения значения тестовой статистики такая же или более экстремальная, чем на самом деле наблюдалось.

Акцент добавлен. То же самое более формально (теорема 10.12):

Предположим, что размер $\alpha$ теста имеет вид

отклонить $H_0$ тогда и только тогда, когда $T(X^n) \ge c_\alpha$ .

Потом,

$p -value = sup_{θ \in Θ_{0}} P_{θ_{0}} [T (X^{n}) \geq T (x^{n})]$ $\text{$p$-value} = \sup_{\theta\in\Theta_0} P_{\theta_0}[T(X^n) \ge T (x^n)]$
где $x^n$ - наблюдаемое значение $X^n$ . Если $\Theta_0=\{\theta_0\}$ то
$p -value = P_{θ_{0}} [T (X^{n}) \geq T (x^{n})]$ $\text{$p$-value} = P_{\theta_0}[T(X^n) \ge T (x^n)]$

Кроме того, Вассерманн определяет p-значение теста Пирсона $\chi^2$ (и других тестов аналогично) как:

p -value = P [χ_{k - 1}^{2} > T] .

$\text{$p$-value} = P[\chi^2_{k-1} > T].$

Часть, которую я хотел бы попросить прояснить, - это знак «больше-равно» ( ) в первом определении и знак «больше» ( ) во втором определении. Почему бы нам не написать , который бы соответствовал первой цитате « такой же как или более экстремальный?» $\ge$ $>$ $\ge T$

Это явное удобство, так что мы вычисляем значение p как ? Я заметил, что R также использует определение со знаком , например, в . $1-F(T)$ $>$ chisq.test

hypothesis-testing chi-squared p-value

— mavam
источник

5

Знаете ли вы, что значение p одинаково для обоих определений, если статистика теста непрерывна?

— mark999

3

Это не имеет значения для непрерывных распределений, но этот факт не должен искушать вас забыть различие между и потому что математически это важно. Это также имеет значение в приложениях, потому что из-за «дискретности реальной жизни» мы можем фактически столкнуться с p-значениями ровно .

\leq

$\leq$

<

$<$

α

$\alpha$

— Хорст Грюнбуш

11

«Как или более экстремальный» это правильно.

Формально, тогда, если распределение таково, что вероятность получения самой тестовой статистики положительна, эта вероятность (и что-либо столь же экстремальное, например, соответствующее значение в другом хвосте) должна быть включена в значение p.

Конечно, при непрерывной статистике эта вероятность точного равенства равна 0. Не имеет значения, если мы говорим или . $>$ $\geq$

— Glen_b - Восстановить Монику
источник

4

Первая точка состоит в том, что пространство гипотез топологически замкнуто во всем пространстве параметров. Без учета случайности это может быть полезным соглашением, если у вас есть какое-то утверждение о сходящейся последовательности параметров, принадлежащих гипотезе, потому что тогда вы будете знать, что предел внезапно не принадлежит альтернативе. $\geq$

Теперь, учитывая распределения вероятностей, они (обычно) непрерывны справа. Это означает, что отображение замкнутого пространства гипотез в интервал снова закрыто. Вот почему доверительные интервалы также закрыты по соглашению. $[0,1]$

Это усиливает математику. Представьте себе, вы бы построили доверительный интервал для параметра местоположения асимметричного распределения вероятностей. Там вам придется обменять длину до верхнего хвоста на длину до нижнего. Вероятность в обоих хвостах должна составлять до . Чтобы CI был как можно более информативным, вам придется сократить длину CI так, чтобы вероятность его охвата по-прежнему составляла . Это закрытый набор. Там вы можете найти оптимальное решение с помощью некоторого итерационного алгоритма, например теоремы Банаха о неподвижной точке. Если бы это был открытый набор, вы не можете сделать это. $\alpha$ $\geq 1-\alpha$

— Хорст Грюнбуш
источник