Очень хороший вопрос! Действительно, имеет смысл, что «хорошее» априорное распределение дает положительную вероятность или положительное значение плотности «истинному» параметру , но с чисто точки зрения это не должно иметь место. Простой контрпример к этой «интуиции», что должно быть необходимо, когда - это предшествующая плотность, а - это «истинное» значение параметра, это блестящий Результат минимаксности Casella и Strawderman (1981): при оценке среднего значения на основе одного наблюдения с дополнительным ограничением , π (θ0π ( ⋅ ) θ 0 μ x ∼ N ( μ , 1 ) | μ | < ρ ρ ρ ≤ 1.0567 { - ρ , ρ } π - ρ ρ μ π ( θ ) = 1
π(θ0)>0
π(⋅)θ0μx∼N(μ,1)|μ|<ρρдостаточно мала, в частности, , минимаксная оценка соответствует (наименее благоприятной) униформе до , что означает, что дает равный вес и ( и ни к какому другому значению среднего )
Когда увеличивается, наименее благоприятный априор видит, что его поддержка растет, но остается конечным набором возможных значений. Однако апостериорное ожидание, , может принимать любое значение .
ρ≤1.0567{−ρ,ρ}π−ρρμπ(θ)=12δ−ρ(θ)+12δρ(θ)
ρE[μ|x](−ρ,ρ)
Суть обсуждения (см. Комментарии) может заключаться в том, что, если бы оценка Байеса ограничивалась точкой поддержки
, его свойства были бы совершенно другими.π(⋅)
Аналогичным образом, при рассмотрении допустимых оценок, оценки Байеса, связанные с надлежащим априором на компактном множестве, обычно допустимы, хотя они имеют ограниченную поддержку.
В обоих случаях понятие «частое лицо» (минимаксность или допустимость) определяется по возможному диапазону параметров, а не по «истинному» значению параметра (что дает ответ на вопрос 4.) Например, если посмотреть на последующий риск
или с риском Байеса
не содержит истинного значения .
∫ΘL(θ,δ)π(θ|x)dθ
∫X∫ΘL(θ,δ)π(θ)f(x|θ)dθdx
θ0
Кроме того, как указано в приведенном выше примере, когда оценщик Байеса определяется формальным выражением, таким как апостериорное среднее значение
для квадратичной (или ) потери, эта оценка может принимать значения вне поддержки в случаях, когда эта поддержка не является выпуклой.
θ^π(x)=∫Θθπ(θ|x)dθ
L2π
Как в сторону, при чтении
для того, чтобы истинное θ сгенерировало данные (то есть «существует»), θ должно быть возможным изменением под π, например, иметь ненулевую вероятность, ненулевую плотность
Я считаю это искажением смысла априора. Предыдущее распределение не должно означать фактический физический (или реальный) механизм, который видел значение параметра сгенерированное из последующим наблюдением сгенерированным из . Предыдущее является эталонной мерой в пространстве параметров, которая включает в себя предварительную информацию и субъективные представления о параметре, и это ни в коем случае не является уникальным. Байесовский анализ всегда относительно предшествующего, выбранного для проведения этого байесовского анализа. Следовательно, нет абсолютной необходимости, чтобы истинный параметр принадлежал поддержке . Очевидно, что когда этот носитель является компактным связным множеством, π x f ( x |θ0πxf(x|θ0)πAлюбое значение параметра вне множества не может быть последовательно оценено апостериорным средним но это даже не мешает оценке быть допустимой.Aθ^π