Кит Винстейн,
РЕДАКТИРОВАТЬ: просто чтобы уточнить, этот ответ описывает пример, приведенный в ответе Кейта Винштейна на короля с жестокой статистической игры. Ответы Байесовский и Фрикалистский оба используют одну и ту же информацию, то есть игнорируют информацию о количестве справедливых и недобросовестных монет при построении интервалов. Если эта информация не игнорируется, участнику следует использовать интегрированное бета-биномиальное правдоподобие в качестве распределения выборки при построении доверительного интервала, и в этом случае доверительный интервал Клоппера-Пирсона не подходит и его необходимо изменить. Аналогичная корректировка должна происходить в байесовском решении.
РЕДАКТИРОВАТЬ: Я также разъяснил первоначальное использование интервала Пепсона клоппера.
РЕДАКТИРОВАТЬ: увы, моя альфа неправильно, и мой интервал Клоппера Пирсона является неправильным. Мои самые скромные извинения @whuber, который правильно указал на это, но с кем я изначально не согласился и проигнорировал.
CI Использование метода Клоппера Пирсона очень хорошо
θ
[Pr(Bi(1,θ)≥X)≥α2]∩[Pr(Bi(1,θ)≤X)≥α2]
X=1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1θ≥α21≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θ1−θ≥α2θ≤1−α2X=0[0.025,1]X=1[0,0.975]X=0
Таким образом, тот, кто использует доверительный интервал Клоппера Пирсона, никогда не будет обезглавлен. После наблюдения интервала это в основном все пространство параметров. Но интервал CP делает это, предоставляя 100% покрытие предположительно 95% интервала! По сути, Frequentists «обманывают», предоставляя на 95% доверительный интервал больший охват, чем его / ее просили дать (хотя кто бы не обманывал в такой ситуации? Если бы это был я, я бы отдал все [0, 1] интервал). Если бы король попросил точный 95% CI, этот частый метод потерпел бы неудачу независимо от того, что на самом деле произошло (возможно, существует лучший вариант?).
Как насчет байесовского интервала? (в частности, Байесовский интервал наивысшей задней десности (HPD))
(θ|X)∼Beta(1+X,2−X)Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe|x=0)=1−(1−θe)2θe=0.05−−−−√≈0.224X=1θe=1−0.05−−−−√≈0.776X=0(0,0.776)X=0(0.224,1)X=1
11012+1×110≈0
0.1
0.0250.975
Чтобы процитировать подлинный 95% доверительный интервал, тогда по определению должны быть некоторые случаи (то есть, по крайней мере, один) наблюдаемого интервала, которые не содержат истинного значения параметра . Иначе, как можно оправдать тег 95%? Разве не будет правильным или недействительным называть его интервалом 90%, 50%, 20% или даже 0%?
Я не вижу, как просто сказать «на самом деле это означает 95% или более» без дополнительных ограничений, является удовлетворительным. Это связано с тем, что очевидным математическим решением является все пространство параметров, а задача тривиальна. Предположим, я хочу 50% CI? если он ограничивает только ложные отрицания, то все пространство параметров является допустимым CI, использующим только этот критерий.
100%X=0100×1012+9101012+1%>95%X=1
В заключение, кажется немного странным запрашивать интервал неопределенности, а затем оценивать этот интервал, используя истинное значение, в котором мы были не уверены. Мне кажется, что «более справедливое» сравнение как по доверительным, так и по достоверным интервалам является правдой утверждения о неопределенности, данного с интервалом .