Я не думаю, что большинство из этих ответов на самом деле отвечают на вопрос в целом. Они ограничены случаем, когда существует простая нулевая гипотеза и когда статистика теста имеет обратимый CDF (как в непрерывной случайной переменной, которая имеет строго увеличивающийся CDF). Эти случаи являются случаями, о которых обычно заботятся большинство людей с помощью z-теста и t-теста, хотя для тестирования биномиального среднего (например) такого CDF нет. То, что приведено выше, кажется правильным для этих ограниченных случаев.
Если нулевые гипотезы составные, то все немного сложнее. Наиболее общее доказательство этого факта, которое я видел в составном случае с использованием некоторых допущений относительно областей отклонения, приведено в «Проверка статистических гипотез» Лемана и Романо, стр. 63–64. Я постараюсь воспроизвести аргумент ниже ...
Мы тестируем нулевую гипотезу против альтернативной гипотезы на основе тестовой статистики, которую мы будем обозначать как случайной величины . Предполагается, что тестовая статистика поступает из некоторого параметрического класса, то есть , где - элемент семейства распределений вероятностей , а - пространство параметров. Нулевая гипотеза и альтернативная гипотеза образуют разбиение в этом
H0H1XX∼PθPθP≡{Pθ∣θ∈Θ}ΘH0:θ∈Θ0H1:θ∈Θ1ΘΘ=Θ0∪Θ1
где
Θ0∩Θ1=∅.
Результат теста можно обозначить
где для любого набора мы определяем
Здесь - наш уровень значимости, а обозначает область отклонения теста для уровня значимости .ϕα(X)=1Rα(X)
S1S(X)={1,0,X∈S,X∉S.
αRαα
Предположим, что области отклонения удовлетворяют
if . В этом случае вложенных областей отклонения полезно определить не только то, отклоняется или нет нулевая гипотеза на данном уровне значимости , но также определить наименьший уровень значимости, для которого нулевая гипотеза будет отклонена. Этот уровень известен как p-значение ,
Это число дает нам представление о насколько сильно данные (представленные в тестовой статистике ) противоречат нулевой гипотезе . Rα⊂Rα′
α<α′αp^=p^(X)≡inf{α∣X∈Rα},
XH0
Предположим, что для некоторого и что . Предположим дополнительно, что области отклонения подчиняются указанному выше свойству вложенности. Тогда имеет место следующее:X∼Pθθ∈ΘH0:θ∈Θ0Rα
Если для всех , то для ,
supθ∈Θ0Pθ(X∈Rα)≤α0<α<1θ∈Θ0Pθ(p^≤u)≤ufor all0≤u≤1.
Если для у нас есть для всех , то для мы имеем
θ∈Θ0Pθ(X∈Rα)=α0<α<1θ∈Θ0Pθ(p^≤u)=ufor all0≤u≤1.
Обратите внимание, что это первое свойство просто говорит нам о том, что уровень ложных срабатываний контролируется для путем отклонения, когда значение p меньше , а второе свойство говорит нам (учитывая дополнительное предположение), что значения p равномерно распределены под нулем гипотеза.uu
Доказательство состоит в следующем:
Пусть и предположим, что для всех . Тогда по определению мы имеем для всех . Из монотонности и предположения следует, что для всех . Если , то .θ∈Θ0supθ∈Θ0Pθ(X∈Rα)≤α0<α<1p^{p^≤u}⊂{X∈Rv}u<vPθ(p^≤u)≤Pθ(X∈Rv)≤vu<vv↘uPθ(p^≤u)≤u
Пусть и предположим, что для всех . Тогда , и по монотонности следует, что . Учитывая (1), следует, что . θ∈Θ0Pθ(X∈Rα)=α0<α<1{X∈Ru}⊂{p^(X)≤u}u=Pθ(X∈Ru)≤Pθ(p^≤u)Pθ(p^(X)≤u)=u
Обратите внимание, что предположение в (2) не выполняется, когда тестовая статистика дискретна, даже если нулевая гипотеза является простой, а не составной. Взять, к примеру, с и . Т.е., переверните монету десять раз и проверьте, справедливо ли она по отношению к головам (закодировано как 1). Вероятность увидеть 10 голов за 10 монетных бросков равна (1/2) ^ 10 = 1/1024. Вероятность увидеть 9 или 10 голов в 10 честных бросках монеты - 11/1024. Для любой строго между 1/1024 и 11/1024 вы бы отклонили ноль, если , но у нас нет этого для этих значений когдаX∼Binom(10,θ)H0:θ=.5H1:θ>0.5αX=10Pr(X∈Rα)=ααθ=0.5 . Вместо для такой . Pr(X∈Rα)=1/1024α