Сравнение байесовских оценок


9
  1. Рассмотрим квадратичную потерю , с заранее заданным \ pi (\ theta), где \ pi (\ theta) \ sim U (0,1 / 2) . Пусть f (x | \ theta) = \ theta x ^ {\ theta-1} \ mathbb {I} _ {[0,1]} (x), \ theta> 0 вероятности. Найти оценку Байеса \ delta ^ \ pi .L(θ,δ)=(θδ)2π(θ)π(θ)U(0,1/2)f(x|θ)=θxθ1I[0,1](x),θ>0δπ

  2. Рассмотрим взвешенную квадратичную потерю Lw(θ,δ)=w(θ)(θδ)2 где w(θ)=I(,1/2) с предшествующим π1(θ)=I[0,1](θ) . Пусть f(x|θ)=θxθ1I[0,1](x),θ>0 - вероятность. Найдите оценку Байеса δ1π .

  3. Сравните δπ и δ1π

Сначала я заметил, что f(x|θ)Beta(θ,1) , и я предположил, что это вероятность, иначе я не получу апостериор, тогда

π(θ|x)f(x|θ)π(θ)=θxθ1I[0,1]2I(0,1/2)(θ)Beta(θ,1)
поэтому оценка Байеса в отношении квадратичной потери равна
E[π(θ|x)]=θθ+1

Я смотрю в книге «Байесовский выбор», и есть теорема об оценке Байеса, связанной с взвешенными квадратичными потерями, и она задается как

δπ(x)=Eπ[w(θ)θ|x]Eπ[w(θ)|x]

Может кто-нибудь объяснить мне, как я это вычисляю?

То, что я пытался это:

δπ(x)=θw(θ)f(x|θ)π(θ)dθw(θ)f(x|θ)π(θ)dθf(x|θ)π(θ)dθw(θ)f(xθ)π(θ)dθ

Я знаю, что поддержка , но когда я пытался интегрировать в числитель[0,12]

θw(θ)f(x|θ)π(θ)dθ=012θθxθ1dθ=1x012θ2xθdθ

Я не получаю хороших результатов.


1
Не является ли неотрицательным здесь? w(θ)
Юхо Коккала

3
Я не понимаю вашего замечания о «только для неотрицательных», потому что (1) функция потерь никогда не станет отрицательной и (2) ваша функция потерь не может быть отрицательной в любом случае. w(θ)
whuber

@whuber Гоша, теперь я осознал свой идиотизм, я смотрел на индикатор поддержки

Ответы:


7

Во-первых, обратите внимание, что я исправил первоначальную формулировку вопроса относительно функций индикатора в ваших определениях вероятности, поскольку они должны быть функциями not . Следовательно, вероятность равна который однозначно интегрируется в один:θ е ( х ) = θ х θ - 1 Я [ 0 , 1 ] ( х ) 1 0 θ х θ - 1 д х = 1xθ

f(x)=θxθ1I[0,1](x)
01θxθ1dx=1

Во-вторых, апостериор в не является бета-функцией, поскольку, как указывает Greenparker Из-за ограничений для значений это также не гамма-распределение, а усечение гамма-распределения.π ( θ | x ) θ

π(θ|x)I[0,1/2](θ)θxθ1I[0,1/2](θ)θexp{log(x)θ}
θ

Следовательно, оценка Байеса - это апостериорное ожидание который может показаться требующим использования неполной гамма-функции, но который может быть получен в закрытой форме путем интегрирования по : начиная с

E[θ|x]=01/2θ×θexp{log(x)θ}dθ/01/2θexp{log(x)θ}dθ=01/2θ2exp{log(x)θ}dθ/01/2θexp{log(x)θ}dθ
01/2θkexp{αθ}dθ=1α[θkexp{αθ}]01/2+kα01/2θk1exp{αθ}dθ
01/2exp{αθ}dθ=1exp{α/2}α

Последнее, как указано в моей книге , действительно, минимизация в эквивалентна минимизации в что само по себе эквивалентно минимизации в что эквивалентно замене исходного предшествующего значения новым предшествующим значением который необходимо перенормировать в плотность, то есть δ

w(θ)(θδ)2π(θ|x)dθ
δ
w(θ)(θδ)2π(θ)f(x|θ)dθ
δ
(θδ)2w(θ)π(θ)f(x|θ)dθ
πw(θ)π(θ)
π1(θ)=w(θ)π(θ)/w(θ)π(θ)dθ

6

Ваш ответ для квадрата ошибки потери является неправильным.

π(θ|x)f(x|θ)π(θ)=2θxθ1I(0,1/2)(θ).

Это распределение по , а не по , а случайная величина в апостериорной области равна . Таким образом, ваш ответ неверен, и правильный ответ будет последним средним этого распределения.Beta(θ,1)xθθ

Для второй части

(Предыдущее значение для функции взвешенных потерь - но вы называете ее . Я переключаю нотацию обратно на .)π1ππ1

Пусть , где - нормализующая константа. Вам нужно рассчитатьπ(θ)=cw(θ)π1(θ)c

δπ1(x)=Eπ1[w(θ)θ|x]Eπ1[w(θ|x)]=w(θ)θf(x|θ)π1(θ)dθw(θ)f(x|θ)π1(θ)dθ=θf(x|θ)π(θ)dθf(x|θ)π(θ)dθ=Eπ[θ|x]

Таким образом, для взвешенной функции наименьших квадратов в теореме говорится, что байесовская оценка является последним средним по отношению к другому априорному значению. Предыдущее существо

π(θ)w(θ)π1(θ).

Нормализующей константой является .θw(θ)π(θ)dθ=Eπ1[w(θ)]

Eπ1[w(θ)]=01/2I0,1(θ)d(θ)=12.

Таким образом, предыдущий является . Это то же самое, что и у вас в первом вопросе.π(θ)=2I(0,1/2)(θ)

Таким образом, ответ для сценариев (что бы это ни было) будет одинаковым. Вы можете найти интеграл здесь . Хотя, может быть, достаточно исправить форму ответа, а не завершить интеграл.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.