Я предполагаю, что вы можете оценить и g с точностью до нормализующей константы. Обозначим f ( x ) = f u ( x ) / c f и g ( x ) = g u ( x ) / c g .fgf(x)=fu(x)/cfg(x)=gu(x)/cg
Последовательная оценка, которая может использоваться, является
где
г = 1 / п
DKLˆ(f||g)=[n−1∑jfu(xj)/πf(xj)]−11N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]−log(r^)
является оценочной выборкой важности для отношения
cf/cg. Здесь вы используете
πfи
πg вкачестве инструментальных плотностей для
fuи
guсоответственно и
πrдля целевого логарифмического отношения ненормализованных плотностей.
r^=1/n1/n∑jfu(xj)/πf(xj)∑jgu(yj)/πg(yj).(1)
cf/cgπfπgfuguπr
Итак, пусть , { y i } ∼ π g и { z i } ∼ π r . Числитель (1) сходится к c f . Знаменатель сходится к c g . Соотношение согласуется по теореме о непрерывном отображении. Лог отношения является постоянным путем непрерывного отображения снова.{xi}∼πf{yi}∼πg{zi}∼πrcfcg
Что касается другой части оценки,
по закону больших чисел.
1N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]→ascfE[log(fu(zi)gu(zi))]
Моя мотивация заключается в следующем:
Так что я просто разбил его на куски.
DKL(f||g)=∫∞−∞f(x)log(f(x)g(x))dx=∫∞−∞f(x){log[fu(x)gu(x)]+log[cgcf]}dx=Ef[logfu(x)gu(x)]+log[cgcf]=c−1fEπr[logfu(x)gu(x)fu(x)πr(x)]+log[cgcf].
Для получения дополнительных идей о том, как смоделировать отношение правдоподобия, я нашел несколько документов:
https://projecteuclid.org/download/pdf_1/euclid.aos/1031594732