Соотношение вероятностей и соотношение PDF-файлов

Я использую Байес для решения проблемы кластеризации. После выполнения некоторых вычислений у меня возникает необходимость получить соотношение двух вероятностей:

P (A) / P (B)

$P(A)/P(B)$

чтобы иметь возможность получить . Эти вероятности получены путем интегрирования двух разных 2D многомерных KDE, как объяснено в этом ответе : $P(H|D)$

P (A) = \iint_{x, y : \hat{f} (x, y) < \hat{f} (r_{a}, s_{a})} \hat{f} (x, y) d x d y

$P(A) = \iint_{x, y : \hat{f}(x, y) < \hat{f}(r_a, s_a)} \hat{f}(x,y)\,dx\,dy$

P (B) = \iint_{x, y : \hat{g} (x, y) < \hat{g} (r_{b}, s_{b})} \hat{g} (x, y) d x d y

$P(B) = \iint_{x, y : \hat{g}(x, y) < \hat{g}(r_b, s_b)} \hat{g}(x,y)\,dx\,dy$

где и являются KDEs и интегрирование выполняется для всех точек ниже пороговых значений и . Оба KDE используют гауссово ядро . Репрезентативное изображение KDE, похожее на то, с которым я работаю, можно увидеть здесь: Интеграция оценки плотности ядра в 2D . $\hat{f}(x, y)$ $\hat{g}(x, y)$ $\hat{f}(r_a, s_a)$ $\hat{g}(r_b, s_b)$

Я вычисляю KDE с помощью pythonфункции stats.gaussian_kde , поэтому я принимаю следующую общую форму:

K D E (x, y) = \frac{1}{n} \sum_{i = 1}^{n} - \frac{1}{2 h^{2}} e^{- \frac{(x - x_{i})^{2} + (y - y_{i})^{2}}{2 h^{2}}}

$KDE(x,y) = \frac{1}{n} \sum_{i=1}^{n} -\frac{1}{2h^2} e^{-\frac{(x-x_i)^2 + (y-y_i)^2}{2h^2}}$

где nдлина моего массива точек и hиспользуемая пропускная способность.

Вышеуказанные интегралы рассчитываются с использованием процесса Монте-Карло, который довольно затратен в вычислительном отношении. Я где-то читал (забыл, где, извините), что в подобных случаях можно заменить отношение вероятностей на соотношение PDF-файлов (KDE), оцененных в пороговых точках, чтобы получить одинаково достоверные результаты. Я заинтересован в этом, потому что вычисление отношения KDEs на несколько порядков быстрее, чем вычисление отношения интегралов с MC.

Таким образом, вопрос сводится к действительности этого выражения:

\frac{P (A)}{P (B)} = \frac{\hat{f} (r_{a}, s_{a})}{\hat{g} (r_{b}, s_{b})}

$\frac{P(A)}{P(B)} = \frac{\hat{f}(r_a, s_a)}{\hat{g}(r_b, s_b)}$

При каких обстоятельствах, если таковые имеются, могу ли я сказать, что это соотношение верно?

[исправлена опечатка (EDIT)]

Добавить :

Вот в основном тот же вопрос, но в более математической форме.

— Габриель
источник

r_{a, b}, s_{a, b}

$r_{a,b}, s_{a,b}$

Я считаю, что соотношение Миллса может быть актуальным.

— whuber

@whuber это соотношение, по-видимому, требует, чтобы я знал значение, P(X)которое я стараюсь избегать. Не могли бы вы немного рассказать об актуальности этого параметра?

— Габриэль

KDE представляет собой смесь нормальных распределений. Давайте посмотрим на один из них.

$P(A)$ $P(B)$ $f$

f (x, y) \leq f (r, s)

$f(x,y) \le f(r,s)$

эквивалентно

x^{2} + y^{2} \geq r^{2} + s^{2} .

$x^2 + y^2 \ge r^2 + s^2.$

$\rho, \theta$

P (r, s) = \frac{1}{2 π} \int_{0}^{2 π} \int_{\sqrt{r^{2} + s^{2}}}^{\infty} ρ \exp (- ρ^{2} / 2) d ρ d θ = \exp (- (r^{2} + s^{2}) / 2) = 2 π f (r, s) .

$P(r,s) = \frac{1}{2\pi}\int_0^{2\pi}\int_\sqrt{r^2+s^2}^\infty \rho \exp(-\rho^2/2) d\rho d\theta= \exp(-(r^2+s^2)/2) = 2\pi f(r,s).$

Теперь рассмотрим смесь. Потому что это линейно,

\begin{aligned} P (r, s) & = \frac{1}{n} \sum_{i} 2 π f ((r - x_{i}) / h, (s - y_{i}) / h) \\ = 2 π h^{2} (\frac{1}{n} \sum_{i} \frac{1}{h^{2}} f ((r - x_{i}) / h, (s - y_{i}) / h)) \\ = 2 π h^{2} K D E (r, s) . \end{aligned}

$\eqalign{ P(r,s) &= \frac{1}{n}\sum_i 2\pi f((r-x_i)/h, (s-y_i)/h) \\ &= 2\pi h^2\left(\frac{1}{n}\sum_i \frac{1}{h^2} f((r-x_i)/h, (s-y_i)/h)\right) \\ &=2\pi h^2 KDE(r,s). }$

$f$ $P$ $2\pi h^2$

$P$ $f$ $f_1$ $A_1$ $f_2$ $A_2$ $A_1$ $\mu\gt 1$ $f=f_1/2 + f_2/2$ $1/2$ $A_1$ $1/(2\mu)$ $A_2$

$(r,s)\in A_1$ $f(r,s)=1/2$ $P(r,s)=1$ $f(r,s)/P(r,s) = 1/2$
$(r,s)\in A_2$ $f(r,s)$ $1/2$ $0$ $A_1$ $1/2$ $f(r,s)/P(r,s) = (1/(2\mu))/(1/2) = 1/\mu$
$f$ $P$

$1$ $1/\mu \ne 1$ $(0,\Sigma)$ $\Sigma$ $f/P$ $[1,1/\mu]$

$P$ $f$ $P$ $\chi^2(2)$ $f$ $P$ должен быть пропорциональным.

— Whuber
источник

Это невероятный ответ, спасибо большое. Мне потребуется некоторое время, чтобы полностью обработать все, что вы написали здесь, но я полностью доверяю вам вычислениям, что означает, что я пометил вопрос как решенный. Приветствия.

— Габриэль