В основном это фон, пропустите до конца, если вы уже достаточно знаете о технологических смесях Дирихле . Предположу , я моделирование некоторых данных как поступающие из смеси процессов Дирихля, т.е. пусть и зависимость от F Предположит Y я я я д ~ ∫ F ( у | & thetas ) Р ( д θ ) .F∼ D ( α H)F
Yя~я я д∫е( у| θ)F( дθ ) .
Здесь и α H - предшествующая базовая мера. Оказывается, что если для каждого наблюдения Y i , если я знаю соответствующий скрытый θ i , вероятность α в этой модели равна L ( α | t ) ∝ α t Γ ( α )α > 0α HYяθяα гдеt- число различных значенийθi(случайная мераFпочти наверняка дискретна). Эскобар и Уэстразрабатывают следующую схему отбора пробαс использованием гамма-измерения; сначала пишутπ(α|t)∝π(α)αtΓ(α)
L ( α | t ) ∝ αTΓ ( α )Γ ( α + n )
TθяFα
где
В ( ⋅ , ⋅ ) является бетафункция. Затем обратите внимание, что если мы введем скрытый параметр
X ∼ Beta ( α + 1 , n )π( α | t ) ∝ π( α ) αTΓ ( α )Γ ( α + n )∝ π( α ) αт - 1( α + n ) B ( α + 1 , n )= π( α ) αт - 1( α + n ) ∫10Иксα( 1 - х )n - 1 dх ,
B ( ⋅ , ⋅ )X∼Beta(α+1,n) тогда вероятность имеет вид смеси гамма-распределений и использует ее для записи сэмплера Гиббса.
L(α|t)∝αtΓ(α)Γ(α+n)=αtΓ(n)Γ(α)Γ(α+n)Γ(n)=αtB(α,n)Γ(n)∝αt∫10xα−1(1−x)n−1 dx,
X∼Beta(α,n)
αaa/b
π(α|t)∝αa+t−2(α+n)e−bα∫10xα(1−x)n−1 dx
Xπ(α,x|t)∝αa+t−2(α+n)e−bαxα(1−x)n−1.
Beta(α+1,n)XG(a+t,b−log(x))G(a+t−1,b−log(x))α
Beta(α,n)XG(a+t,b−log(x))α