Доверительный интервал для дисперсии с учетом одного наблюдения


25

Это проблема из «7-й Колмогоровской студенческой олимпиады по теории вероятностей»:

Учитывая одно наблюдение из распределения с неизвестными обоими параметрами, задайте доверительный интервал для с уровнем достоверности не менее 99%.Нормальный ( μ , σ 2 ) σ 2XNormal(μ,σ2)σ2

Мне кажется, что это должно быть невозможно. У меня есть решение, но я еще не читал его. Есть предположения?

Я выложу решение через пару дней.

[Последующее редактирование: официальное решение опубликовано ниже. Решение кардинала длиннее, но дает лучший доверительный интервал. Спасибо также Максу и Glen_b за их вклад.]


1
Мне тоже кажется невозможным; Я жду ответа
Питер Флом - Восстановить Монику


3
Вот бумага с лучшим форматированием: бумага .
предполагается нормальным

Хех. Я помню, как читал статью об этом материале (один интервал наблюдения) много лет назад. Может быть это одна.
Glen_b

1
@ Макс, спасибо за ссылку! У меня еще не было времени внимательно посмотреть на это, но я буду. Я разместил «официальный» ответ ниже.
Джонатан Кристенсен

Ответы:


17

Если смотреть сквозь призму вероятностных неравенств и связей со случаем многократного наблюдения, этот результат может показаться не таким уж невозможным или, по крайней мере, может показаться более правдоподобным.

Пусть с μ и σ 2 неизвестны. Мы можем записать X = σ Z + μ для Z N ( 0 , 1 ) .X~N(μ,σ2)μσ2Иксзнак равноσZ+μZ~N(0,1)

Основное утверждение : - это ( 1 - α ) доверительный интервал для σ 2, где q α - квантиль α- уровня распределения хи-квадрат с одной степенью свободы. Кроме того, поскольку этот интервал имеет ровно ( 1 - α ) покрытие при μ = 0 , это самый узкий возможный интервал вида [ 0 , b X 2 )[0,Икс2/Qα)(1-α)σ2Qαα (1-α)μзнак равно0[0,бИкс2)для некоторого .бр

Повод для оптимизма

Напомним , что в случая, с Т = Е п I = 1 ( Х я - ˉ Х ) 2 , то типичная ( 1 - α ) доверительный интервал для сг 2 является ( ТN2Tзнак равноΣязнак равно1N(Икся-Икс¯)2 (1-α)σ2 Где Q к , являетсяуровневый квантиль хи-квадрат с K степенями свободы. Это, конечно, верно для любого µ . Хотя этосамый популярныйинтервал (называемый интервалом сравными хвостамипо понятным причинам), он не является ни единственным, ни дажеинтерваломнаименьшей ширины! Как должно быть очевидно, другой действительный выбор ( 0 , T

(TQN-1,(1-α)/2,TQN-1,α/2),
QК,aaКμ
(0,TQN-1,α),

Так, , то ( 0 , Е п я = 1 X 2 ITΣязнак равно1NИкся2 Также имеет покрытие по меньшей мере ( 1 - & alpha ; ) .

(0,Σязнак равно1NИкся2QN-1,α),
(1-α)

В этом свете мы можем быть оптимистичны в том, что интервал в главном утверждении истинен для . Основное отличие состоит в том, что для случая одного наблюдения не существует распределения хи-квадрат с нулевой степенью свободы, поэтому мы должны надеяться, что использование квантиля с одной степенью свободы будет работать.Nзнак равно1

Полшага к нашему месту назначения ( Эксплуатация правого хвоста )

Прежде чем углубиться в доказательство основного утверждения, давайте сначала посмотрим на предварительное утверждение, которое не так сильно или статистически не удовлетворяет, но, возможно, дает некоторое дополнительное понимание происходящего. Вы можете перейти к доказательству основной претензии ниже, без особых (если таковые имеются) потерь. В этом и следующем разделах доказательства, хотя и немного тонкие, основаны только на элементарных фактах: монотонности вероятностей, симметрии и унимодальности нормального распределения.

Дополнительное требование : является ( 1 - α ) доверительный интервал для сг 2 до тех пор , как & alpha ; > 1 / 2 . Здесь z α - квантиль α- уровня стандартной нормали.[0,X2/Zα2)(1-α)σ2α>1/2Zαα

Доказательство . и | σ Z + μ | д = | - σ Z + μ | по симметрии, поэтому в дальнейшем мы можем взять μ 0 без потери общности. Теперь, для & thetas ; 0 и ц 0 , Р ( | Х | > & thetas ; ) Р ( Х > & thetas ; )|Икс|знак равно|-Икс||σZ+μ|знак равноd|-σZ+μ|μ0θ0μ0 И так с θ = г & alpha ; сг , мы видимчто Р ( 0 & le ; сг 2 < Х 2 / г 2 & alpha ; ) 1 - & alpha ;

п(|Икс|>θ)п(Икс>θ)знак равноп(σZ+μ>θ)п(Z>θ/σ),
θзнак равноZασ Это работает только для альфа > 1 / 2 , такэто точто нужно для г α > 0 .
п(0σ2<Икс2/Zα2)1-α,
α>1/2Zα>0

Это доказывает вспомогательное требование. Хотя это показательно, с статистической точки зрения это неутешительно, поскольку для работы требуется абсурдно большое значение .α

Обоснование основной претензии

Уточнение приведенного выше аргумента приводит к результату, который будет работать для произвольного уровня достоверности. Во-первых, отметим, что Положим a = μ / σ 0 и b = θ / σ 0 . Тогда P ( | Z + a | > b ) = Φ ( a - b ) + Φ ( - a - b )

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0 Если мы можем показать, что правая часть увеличивается в a для каждого фиксированного b , то мы можем использовать аргумент, аналогичный предыдущему. Это, по крайней мере, правдоподобно, поскольку мы хотели бы верить, что если среднее значение увеличивается, то становится более вероятным, что мы увидим значение с модулем, который превышает b . (Тем не менее, мы должны следить за тем, как быстро уменьшается масса в левом хвосте!)
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb

Положим . Тогда f b ( a ) = φ ( a - b ) - φ ( - a - b ) = φ ( a - b ) - φ ( a + b )fb(a)=Φ(ab)+Φ(ab) Заметимчто F ' б ( 0 ) = 0 и для положительного U , φ ( U ) убывает по ц . Теперь для a ( 0 , 2 b ) легко видеть, что φ ( a - b ) φ ( - b ) = φ ( b ) . Эти факты, взятые вместе, легко означают, что f b ( a

fb(a)=φ(ab)φ(ab)=φ(ab)-φ(a+б),
еб'(0)знак равно0Uφ(U)Ua(0,2б)φ(a-б)φ(-б)знак равноφ(б) для всех a 0 и любых фиксированных b 0 .
еб'(a)0
a0б0

Таким образом, мы показали , что при 0 и б 0 , Р ( | Z + | > б ) P ( | Z | > б ) = 2 Ф ( - б )a0б0

п(|Z+a|>б)п(|Z|>б)знак равно2Φ(-б),

Распутывая все это, если мы возьмем θзнак равноQασ

п(Икс2>Qασ2)п(Z2>Qα)знак равно1-α,

Заключительное замечание : внимательное прочтение приведенного выше аргумента показывает, что он использует только симметричные и унимодальные свойства нормального распределения. Следовательно, подход работает аналогично для получения доверительных интервалов из одного наблюдения из любого симметричного унимодального семейства масштабов местоположений, например, распределений Коши или Лапласа.


Вот Это Да! а студенты должны выступить с такими аргументами за короткое время олимпиады?
Дилип Сарватэ

1
@Dilip: Понятия не имею! Я не знаком с форматом этой олимпиады или тем, что ожидается с точки зрения решения. Из буквального прочтения я думаю, что ответ Скорчи будет приемлемым. Меня больше интересовало попытка выяснить, как далеко можно зайти с «нетривиальным» решением. Мое собственное (довольно минимальное) исследование следовало тому же ходу мыслей, описанному в ответе (с одним обходным путем). Вполне вероятно, что существует лучшее решение. :-)
кардинал

Это значительно дольше, чем «официальное» решение, но дает лучшую оценку дисперсии, поэтому я отмечаю его как «правильный» ответ. Я разместил «официальный» ответ ниже, а также некоторые результаты моделирования и обсуждения. Спасибо, @cardinal!
Джонатан Кристенсен

2
@ Джонатан: Спасибо. Да, я мог бы сделать доказательство более кратким. Из-за широкого круга участников, присутствующих здесь, я часто склонен заниматься дополнительными (или, возможно, чрезмерными) деталями. :-)
кардинал

12

Время следить за! Вот решение, которое мне дали:

[0,T(Икс))T()

(μр)(σ>0)пμ,σ2(σ2>T(Икс))<0,01.
N(μ,σ2)1/σ2πп(|Икс|a)a/σa0
Tп(|Икс|/σT)знак равноп(Икс2T2σ2)знак равноп(σ2Икс2/T2),
Tзнак равно0,01T(Икс)знак равно10000Икс2,

Доверительный интервал (который является очень широким) является слегка консервативным в моделировании, при этом эмпирическое покрытие (в 100 000 моделированиях) ниже 99,15%, так как я изменял CV на многие порядки.

6300Икс210000Икс2в предоставленном решении. Эмпирическое покрытие прямо на номинальном уровне, опять же на много порядков для CV. Так что его интервал определенно выигрывает.

У меня не было времени внимательно посмотреть на статью Макса, но я планирую посмотреть на нее и могу добавить некоторые комментарии по этому поводу позже (то есть не раньше, чем через неделю). Этот документ претендует на 99% доверительный интервал(0,4900Икс2), который имеет эмпирическое покрытие немного ниже (около 98,85%), чем номинальное покрытие для больших резюме в моих кратких моделированиях.


1
(+1) Это хорошее решение. Если у вас естьT вместо того Tв уравнении дисплея?
кардинал

2
Еще пара моментов: ваше решение может быть сделано очень близко к моему без каких-либо изменений в аргументе. Обратите внимание, что вы можете утверждать, чтоп(|Икс|a)2a/σ2π, Тогда интервал становится(0,2Икс2/πα2) для любого α, С помощьюαзнак равно0,01 доходность T(Икс)6366.198Икс2 по сравнению с 1/Q0,016365.864в моем ответе. Чем выше уровень достоверности (т. Е. Чем меньшеα), чем ближе ваш метод к моему (хотя ваш интервал всегда будет шире).
кардинал

1
Во-вторых, я не смотрел на эту статью, но у меня есть серьезные сомнения в том, что (0,4900Икс2)может быть действительным доверительным интервалом 99%. Действительно, рассмотрим все доверительные интервалы вида(0,бИкс2) для некоторых б, Потом, когдаμзнак равно0у нас есть это Икс2/σ2 точно хи-квадрат с одной степенью свободы и поэтому самый маленький б мы могли бы выбрать в этом случае бзнак равно1/Qα, Другими словами, интервал, указанный в моем ответе, является самой узкой из возможных форм.
кардинал

1
Я сделал (подозреваемый) исправление опечатки. Кроме того, pchisq(1/4900,1,lower.tail=F)в Rрезультатах 0.9886, довольно близко к вашим результатам моделирования для(0,4900Икс2) интервал.
кардинал

1
Спасибо за все комментарии, @cardinal. Я думаю, что ваши изменения верны, хотя я напечатал их так, как это было в оригинальных решениях - опечатка там, я думаю.
Джонатан Кристенсен

5

КИ (0,) предположительно.


1
Я думаю, вам было бы полезно сказать, почему вы не можете получить доверительный интервал конечной длины.
предположительно нормальное

1
@ Макс Я не достаточно умен, но вопрос не задан.
Scortchi - Восстановить Монику

4
+1 за это. Вопрос не говорит о КИ с минимальным охватом, и на самом деле подразумевает, что это может быть приемлемо через его любопытную формулировку, «доверительный интервал с уровнем достоверности не менее 99%».
Ари Б. Фридман
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.