ЭМ алгоритм Практика Задача


9

Это практическая проблема для промежуточного экзамена. Проблема в примере алгоритма EM. У меня проблемы с частью (е). Я перечисляю части (a) - (e) для завершения и в случае, если я допустил ошибку ранее.

Пусть - независимые экспоненциальные случайные величины со скоростью . К сожалению, фактические значения не наблюдаются, и мы только наблюдаем, попадают ли значения в определенные интервалы. Пусть , и для . Наблюдаемые данные состоят из .X1,,XnθXXG1j=1{Xj<1}G2j=1{1<Xj<2}G3j=1{Xj>2}j=1,,n(G1j,G2j,G3j)

(а) Дайте наблюдаемую вероятность данных:

L(θ|G)=j=1nPr{Xj<1}G1jPr{1<Xj<2}G2jPr{Xj>2}G3j=j=1n(1eθ)G1j(eθe2θ)G2j(e2θ)G3j

(б) Дайте полную вероятность данных

L(θ|X,G)=j=1n(θeθxj)G1j(θeθxj)G2j(θeθxj)G3j

(c) Выведите прогнозную плотность скрытой переменной f(xj|G,θ)

f(xj|G,θ)=fX,G(xj,g)fG(g)=θeθxj1{xjregion r s.t. Grj=1}(1eθ)g1j(eθe2θ)g2j(e2θ)g3j

(г) Электронный шаг. Дайте функциюQ(θ,θi)

Q(θ,θi)=EX|G,θi[logf(x|G,θ)]=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθe2θ)N3loge2θ=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθ(1eθ))+2θN3=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3

гдеN1=j=1ng1j,N2=j=1ng2j,N3=j=1ng3j

(e) Дайте выражения для для . r = 1 , 2 , 3E[Xj|Grj=1,θi]r=1,2,3

Я перечислю свои результаты, которые, я уверен, верны, но вывод будет немного длинным для этого и без того непростого вопроса:

E[Xj|G1j=1,θi]=(11eθi)(1θieθi(1+1/θi))E[Xj|G2j=1,θi]=(1eθie2θi)(eθi(1+1/θi)e2θi(2+1/θi))E[Xj|G3j=1,θi]=(1e2θi)(e2θi(2+1/θi))

Это часть, на которой я застрял, и это может быть из-за более ранней ошибки:

(е) M-Step. Найдите которая максимизируетQ ( θ , θ i )θQ(θ,θi)

Из закона полного ожидания мы имеем ThereforE[Xj|G,θi]=(1θieθi(1+1/θi))+(eθi(1+1/θi)e2θi(2+1/θi))+(e2θi(2+1/θi))=1/θi

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3=nlogθθnθiN1log(1eθ)+θN2N2log(1eθ)+2θN3Q(θ,θi)θ=nθnθi(N1+N2)eθ1eθ+N2+2N3

Затем я должен установить это значение равным нулю и решить для , но я пробовал это в течение очень долгого времени, и я не могу решить для !θθθ


Я интерпретировал как силу на минуту. Самое запутанное. Обычно номер итерации (номер шага) указывается в скобках или скобках чтобы не путали с степенью . Наверное, лучше всего хотя бы сказать, что это именно то, о чем идет речь (при условии, что теперь я правильно понял). θ [ i ] ( i ) θ ( i ) i θ iθiθ[i](i)θ(i)iθi
Glen_b

1
Да, Глен, извините за это, это действительно я итерация алгоритма EM. i
bdeonovic,

Ответы:


5

Полная вероятность данных не должна включать G! Это просто должно быть вероятностью когда являются экспоненциальными. Обратите внимание, что полная вероятность данных, которую вы записали, упрощается до экспоненциальной вероятности, поскольку только один из может равняться 1. Однако, если оставить в полной вероятности данных, это может вас испортить позже. X G r j GθXGrjG

В части (d) следует учитывать ожидание полной вероятности регистрации данных, а не наблюдаемую вероятность регистрации данных.

Кроме того, вы не должны использовать закон полного ожидания! Напомним, что G наблюдается и не является случайным, поэтому вы должны выполнять только одно из этих условных ожиданий для каждого . Просто замените это условное ожидание термином и затем выполните M-шаг.X ( i ) jXjXj(i)


@ Бенджамин Как продвигается проблема? Могу ли я помочь вам понять, как это сделать?
Jsk

Спасибо за комментарии @jsk. Я устал вчера вечером, поэтому я лег спать, но сегодня утром после завтрака я снова
займусь этим

Я думаю, что я понял это! Еще раз спасибо! Это было на самом деле в подготовке к финалу, который у меня сегодня, так что это действительно помогло прояснить некоторые вещи о EM.
bdeonovic,

Пожалуйста. Надеюсь, ваш финал пройдет хорошо сегодня!
JSK

4

На основании комментариев @ jsk я постараюсь исправить свои ошибки:

L(θ|X,G)=j=1nθeθxj

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]=nlogθθ(j=1ng1j1eθi)(1θieθi(1+1/θi))θ(j=1ng2jeθi(1eθi))(eθi(1+1/θi)e2θi(2+1/θi))θ(j=1ng3je2θi)(e2θi(2+1/θi))=nlogθθN1AθN2BθN3CQ(θ,θi)θ=nθN1AN2BN3C=set0

Решая для мы получаемθ ( i + 1 ) = nθθ(i+1)=nN1A+N2B+N3C

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.