Прошу прощения за поздний ответ, но это меня тоже задело, и я нашел ответ. Распределение действительно Dirichlet-Multinomial и индивидуальный нег. биномиальные распределения даже не должны быть идентичными, если их коэффициент Фано (отношение дисперсии к среднему) идентичен.
Длинный ответ:
Если вы параметризируете NB как:
p(X=x|λ,θ)=NB(x|λ,θ)=(θ−1λ+x−1x)(11+θ−1)x(θ−11+θ−1)θ−1λ
Тогда и иE(X)=λVar(X)=λ(1+θ)
∀i:Xi∼NB(λi,θ) подразумевает
∑Xi∼NB(∑λi,θ)
Затем, принимая вероятность с учетом суммы:
∏NB(xi|λi,θ)NB(∑xi|∑λi,θ)=(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi∏(θ−1λi+xi−1xi)(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi(θ−1∑λi+∑xi−1∑xi)==Γ(∑xi+1)Γ(θ−1∑λi)Γ(θ−1∑λi+∑xi)∏Γ(θ−1λi+xi)Γ(xi+1)Γ(θ−1λi)=DM(x1,...,xn|θ−1λ1,...,θ−1λn)
где - вероятность Дирихле-Полиномиальная. Это объясняется просто тем фактом, что, за исключением многочленных коэффициентов, многие слагаемые в дробной части левой части сокращаются, оставляя вас только с членами гамма-функции, которые совпадают с вероятностью DM.DM
Также обратите внимание, что параметры этой модели нельзя идентифицировать, так как увеличение с одновременным уменьшением всех приводит к точно такой же вероятности.θλi
Лучшее упоминание, которое у меня есть для этого, - это разделы 2–3,1 Guimarães & Lindrooth (2007): «Управление избыточным рассеянием в сгруппированных условных логит-моделях: простое в вычислительном отношении применение полиномиальной регрессии Дирихле - к сожалению, она расплатилась, но я не смог найти неоплачиваемую ссылку.