Да и нет.
Сначала "да"
Вы заметили, что когда тест и доверительный интервал основаны на одной и той же статистике, между ними существует эквивалентность: мы можем интерпретировать значение как наименьшее значение α, для которого нулевое значение параметра будет быть включены в 1 - α доверительный интервал.pα1−α
Пусть - неизвестный параметр в пространстве параметров Θ ⊆ R , и пусть образец x = ( x 1 , … , x n ) ∈ X n ⊆ R n - реализация случайной величины X = ( X 1 , … , Х н ) . Для простоты определим доверительный интервал I α ( X ) как случайный интервал, так что его вероятность покрытия P θθΘ⊆Rx=(x1,…,xn)∈Xn⊆RnX=(X1,…,Xn)Iα(X)
(Аналогичным образом можно рассмотреть более общие интервалы, где вероятность покрытия либо ограничена, либо приблизительно равна 1 - α
Pθ(θ∈Iα(X))=1−αfor all α∈(0,1).
1−α . Рассуждения аналогичны.)
Рассмотрим двусторонний тест точечной нулевой гипотезы против альтернативной области отклонения H 1 представляет собой наборH0(θ0):θ=θ0 . Пусть λ ( θ 0 , x ) обозначает p-значение теста. Для любого альфа ∈ ( 0 , 1 ) , Н 0 ( θ 0 ) отклоняется на уровне & alpha ; еслиH1(θ0):θ≠θ0λ(θ0,x)α∈(0,1)H0(θ0)α . Областьуровня α λ ( θ 0 , x ) ≤ α } .λ(θ0,x)≤αα которое приводит к отклонению H 0 ( θ 0 ) :
R α ( θ 0 ) = { x ∈ R n :xH0(θ0)
Rα(θ0)={x∈Rn:λ(θ0,x)≤α}.
Теперь рассмотрим семейство двусторонних тестов с p-значениями для θ ∈ Θ . Для такого семейства мы можем определить инвертированную область отклонения Q α ( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α } .λ(θ,x)θ∈Θ
Qα(x)={θ∈Θ:λ(θ,x)≤α}.
При любом фиксированном , Н 0 ( θ 0 ) отклоняется , если х ∈ R α ( θ 0 ) , что происходит тогда и только тогда , когда θ 0 ∈ Q α ( х ) , то есть
х ∈ R α ( θ 0 ) ⇔ θ 0 ∈ Q α ( x ) .
Если тест основан на тестовой статистике с полностью заданным абсолютно непрерывным нулевым распределением, тоθ0H0(θ0)x∈Rα(θ0)θ0∈Qα(x)
x∈Rα(θ0)⇔θ0∈Qα(x).
при
H 0 ( θ 0 ) . Тогда
Р θ 0 ( ; & alpha ; ) = & alpha ; .
Поскольку это уравнение верно для любого
θ 0 ∈ Θλ(θ0,X)∼U(0,1)H0(θ0)Pθ0(X∈Rα(θ0))=Pθ0(λ(θ0,X)≤α)=α.
θ0∈Θи так как уравнение над ней следует , что
отсюда следует , что случайный набор
Q α ( х ) всегда покрывает истинный параметр
θ 0 с вероятностью
C α ( x ) обозначает дополнение к
QPθ0(X∈Rα(θ0))=Pθ0(θ0∈Qα(X)),
Qα(x)θ0 . Следовательно, пусть
QαQCα(x) , для всех
θ 0 ∈ Θ имеем
P θ 0 ( θ 0 ∈ Q C α ( X ) ) = 1 - α ,
что означает, что дополнением к области перевернутого отклонения является
1 - α доверительный интервал для
θ ,
Qα(x)θ0∈ΘPθ0(θ0∈QCα(X))=1−α,
1−αθ
zθx¯σ=1H0(θ)(x¯,θ)R0.05(−0.9)=(−∞,−1.52)∪(−0.281,∞)I0.05(1/2)=QC0.05(1/2)=(−0.120,1.120)
(Многое из этого взято из моей кандидатской диссертации .)
Теперь для «нет»
θX . Обычно такие интервалы не соответствуют тесту.
Это явление связано с проблемами, связанными с тем, что такие интервалы не являются вложенными, а это означает, что интервал 94% может быть короче интервала 95%. Подробнее об этом см. Раздел 2.5 этой моей недавней статьи (появится в Бернулли).
И второе "нет"
θ0=0 может быть отклонен с помощью теста , даже если 0 входит в доверительный интервал. Это не противоречит приведенному выше «да», так как используются разные статистические данные.
И иногда "да" не очень хорошая вещь
Как указывает f Коппенс в комментарии, иногда интервалы и тесты имеют несколько противоречивые цели. Мы хотим короткие интервалы и тесты с высокой мощностью, но самый короткий интервал не всегда соответствует тесту с самой высокой мощностью. Некоторые примеры этого см. В этой статье (многомерное нормальное распределение), или в этом (экспоненциальное распределение), или в разделе 4 моей диссертации .
Байесовцы могут также сказать, да и нет
Несколько лет назад я разместил здесь вопрос о том, существует ли эквивалентность тестового интервала также в байесовской статистике. Короткий ответ: при стандартном тестировании байесовских гипотез ответом будет «нет». Немного переформулировав проблему тестирования, можно получить ответ «да». (Мои попытки ответить на мой собственный вопрос в конечном итоге превратились в бумагу !)