11

Скажем, что $Y$ - непрерывная случайная величина, а $X$ - дискретная.

Pr (X = x | Y = y) = \frac{Pr (X = x) Pr (Y = y | X = x)}{Pr (Y = y)}

$\Pr(X=x|Y=y) = \frac{\Pr(X=x)\Pr(Y=y|X=x)}{\Pr(Y=y)}$

Как мы знаем, $\Pr(Y=y) = 0$ потому что $Y$ - непрерывная случайная величина. И на основании этого я испытываю желание сделать вывод, что вероятность $\Pr(X=x|Y=y)$ не определена.

Тем не менее, Википедия утверждает здесь, что она на самом деле определяется следующим образом:

Pr (X = x | Y = y) = \frac{Pr (X = x) f_{Y | X = x} (y)}{f_{Y} (y)}

$\Pr(X=x|Y=y) = \frac{\Pr(X=x) f_{Y|X=x}(y)}{f_Y(y)}$

Вопрос: Есть идеи, как Википедии удалось определить эту вероятность?

Моя попытка

Вот моя попытка получить этот результат Википедии с точки зрения ограничений:

\begin{aligned} Pr (X = x | Y = y) & = \frac{Pr (X = x) Pr (Y = y | X = x)}{Pr (Y = y)} \\ = lim_{d \to 0} \frac{Pr (X = x) (d \times f_{Y | X = x} (y))}{(d \times f_{Y} (y))} \\ = lim_{d \to 0} \frac{Pr (X = x) (d \times f_{Y | X = x} (y))}{(d \times f_{Y} (y))} \\ = \frac{Pr (X = x) f_{Y | X = x} (y)}{f_{Y} (y)} \end{aligned}

$\begin{split}\require{cancel} \Pr(X=x|Y=y) &= \frac{\Pr(X=x)\Pr(Y=y|X=x)}{\Pr(Y=y)}\\ &= \lim_{d \rightarrow 0}\frac{\Pr(X=x) \big(d \times f_{Y|X=x}(y)\big)}{\big(d \times f_Y(y)\big)}\\ &= \lim_{d \rightarrow 0}\frac{\Pr(X=x) \big(\cancel{d} \times f_{Y|X=x}(y)\big)}{\big(\cancel{d} \times f_Y(y)\big)}\\ &= \frac{\Pr(X=x) f_{Y|X=x}(y)}{f_Y(y)}\\ \end{split}$

Теперь $\Pr(X=x|Y=y)$ , по-видимому, определяется как $\frac{\Pr(X=x) f_{Y|X=x}(y)}{f_Y(y)}$ , что соответствует эта претензия в Википедии.

Это то, как Википедия это сделала?

Но я все еще чувствую, что я злоупотребляю исчислением здесь. Поэтому я думаю, что $\Pr(X=x|Y=y)$ не определено, но в максимально возможной степени мы можем определить $\Pr(Y=y)$ и $\Pr(Y=y|X=x)$ , но не сразу, тогда $\Pr(X=x|Y=y)$ определено.

Но я в значительной степени не уверен во многих вещах, в том числе в уловке пределов, которую я там сделал, я чувствую, что, возможно, я даже не до конца понимаю смысл того, что я сделал.

conditional-probability pdf

— троглодит
источник

1

Действительно, Pr (X = x) = 0, но плотность X в xf (x) может быть не равна 0. Разве вы не должны использовать ярлык «самообучение» ??

— Lil'Lobster

2

@Lil Насколько я знаю, тег «самообучения» предназначен для решения домашних заданий. Я этого не делаю.

— пещерный человек

1

Страница Википедии фактически ссылается на происхождение: en.wikipedia.org/wiki/Bayes'_theorem#Derivation

— Ицен де Бур

3

Боюсь, ваш вывод не имеет математического обоснования, так как для всех когда непрерывен.

P (Y = y) = 0

$\mathbb{P}(Y=y)=0$

y \in Y

$y\in\mathcal{Y}$

Y

$Y$

— Сиань

10

Условное распределение вероятностей , , , формально определяется как решение уравнения , где обозначает - алгебра , связанная с распределением . Одно из этих решений обеспечивается формулой Байеса (1763), как указано в Википедии : $\mathbb{P}(X=x|Y=y)$ $x\in\mathcal{X}$ $y\in\mathcal{Y}$

P (X = x, Y \in A) = \int_{A} P (X = x | Y = y) f_{Y} (y) d y \forall A \in σ (Y)

$\mathbb{P}(X=x,Y\in A)=\int_{A}\mathbb{P}(X=x|Y=y)f_Y(y)\text{d}y\quad\forall A\in\sigma(\mathcal{Y})$

σ (Y)

$\sigma(\mathcal{Y})$

σ

$\sigma$

Y

$Y$

P (X = x | Y = y) = \frac{P (X = x) f_{Y | X = x} (y)}{f_{Y} (y)} \forall x \in X, y \in Y

$\mathbb{P}(X=x|Y=y) = \dfrac{\mathbb{P}(X=x) f_{Y|X=x}(y)}{f_Y(y)}\qquad\forall x\in\mathcal{X},\ y\in\mathcal{Y}$ хотя версии, которые произвольно определены для набора ноль мер в , также допустимы.

σ (Y)

$\sigma(\mathcal{Y})$

Понятие условной вероятности относительно изолированной гипотезы, вероятность которой равна 0, недопустимо. Ибо мы можем получить распределение вероятности для [широты] на меридианной окружности только в том случае, если рассматривать эту окружность как элемент разложения всей сферической поверхности на меридианные окружности с заданными полюсами - Андрей Колмогоров

Как показывает парадокс Бореля-Колмогорова , при заданном значении потенциально взятом , условное распределение вероятностей не имеет точного значения не только потому, что событие имеет нулевую меру, но также потому, что это событие можно интерпретировать как измеримое по бесконечному диапазону -алгебр. $y_0$ $Y$ $\mathbb{P}(X=x|Y=y_0)$ $\{\omega;\,Y(\omega)=y_0\}$ $\sigma$

Примечание: вот еще более формальное введение, взятое из обзора теории вероятностей в блоге Терри Тао :

Определение 9 (дезинтеграции) Пусть является случайной величиной с расстояния . Дезинтеграции от лежащей в основе выборочного пространства относительно представляет собой подмножество из полной меры в (таким образом почти наверняка) вместе с присвоением вероятностной меры на подпространстве of для каждого , который измерим в том смысле, что отображение $Y$ $R$ $(R', (\mu_y)_{y \in R'})$ $\Omega$ $Y$ $R'$ $R$ $\mu_Y$ $Y \in R'$ ${\bf P}(|Y=y)$ $\Omega_y := \{ \omega \in \Omega: Y(\omega)=y\}$ $\Omega$ $y \in R$ $y \mapsto {\bf P}(F|Y=y)$ измеримо для каждого события и такого, что для всех таких событий, где (почти наверняка определенная) случайная величина, определенная равной всякий раз, когда . $F$
$P (F) = E P (F | Y)$ $\displaystyle {\bf P}(F) = {\bf E} {\bf P}(F|Y)$ ${\bf P}(F|Y)$ ${\bf P}(F|Y=y)$ $Y=y$
При таком распаде мы можем затем обусловить событие для любого , заменив подпространством (с индуцированной -algebra), но заменив основную меру вероятности с . Таким образом, мы можем обусловить (безусловные) события и случайные величины этим событием, чтобы создать условные события и случайные величины в условном пространстве, что приводит к условным вероятностям $Y=y$ $y \in R'$ $\Omega$ $\Omega_y$ $\sigma$ ${\bf P}$ ${\bf P}(|Y=y)$ $F$ $X$ $(F|Y=y)$ $(X|Y=y)$ ${\bf P}(F|Y=y)$ (что согласуется с существующими обозначениями этого выражения) и условными ожиданиями (при условии абсолютной интегрируемости в этом условном пространстве). Затем мы устанавливаем как (почти наверняка определенную) случайную величину, определенную равной всякий раз, когда . ${\bf E}(X|Y=y)$ ${\bf E}(X|Y)$ ${\bf E}(X|Y=y)$ $Y=y$

— Сиань
источник

1

Уже +1, но ... может быть, это придирки, но не будет ли более точным ссылаться на теорему Байеса как формулу Байеса / Лапласа ..?

— Тим

2

@Tim: спасибо, но я не хочу звучать слишком шовинистично! И это факт, что формула Байеса для дискретных (биномиальных) и непрерывных (бета) появляется в статье Байеса (1763). Конечно, Лаплас поставил результат в гораздо более широком смысле.

X

$X$

Y

$Y$

— Сиань

4

Я дам эскиз того, как части могут совмещаться, когда непрерывно, а дискретно. $Y$ $X$

Плотность смешанного соединения:

f_{X Y} (x, y)

$f_{XY}(x,y)$

Предельная плотность и вероятность:

f_{Y} (y) = \sum_{x \in X} f_{X Y} (x, y)

$f_Y(y) = \sum_{x \in X} f_{XY}(x, y)$

P (X = x) = \int f_{X Y} (x, y) d y

$P(X = x) = \int f_{XY}(x, y) \;dy$

Условная плотность и вероятность:

f_{Y ∣ X} (y ∣ X = x) = \frac{f_{X Y} (x, y)}{P (X = x)}

$f_{Y\mid X}(y \mid X = x) = \frac{f_{XY}(x, y)}{P(X=x)}$

P (X = x ∣ Y = y) = \frac{f_{X Y} (x, y)}{f_{Y} (y)}

$P(X=x \mid Y = y) = \frac{f_{XY}(x, y)}{f_Y(y)}$

Правило Байеса:

f_{Y ∣ X} (y ∣ X = x) = \frac{P (X = x ∣ Y = y) f_{Y} (y)}{P (X = x)}

$f_{Y\mid X}(y \mid X = x) = \frac{P(X=x \mid Y = y) f_Y(y)}{P(X=x)}$

P (X = x ∣ Y = y) = \frac{f_{Y ∣ X} (y ∣ X = x) P (X = x)}{f_{Y} (y)}

$P(X=x \mid Y = y) = \frac{f_{Y\mid X}(y \mid X = x)P(X=x)}{f_Y(y)}$

Конечно, современный строгий способ борьбы с вероятностью - это теория меры. Для точного определения см. Ответ Сианя.

— Мэтью Ганн
источник

2

Обратите внимание, что статья в Википедии фактически использует следующее определение: то есть трактует результат как плотность, а не как вероятность, как у вас есть. Поэтому я бы сказал, что вы правы, что не определено, когда непрерывен, а дискретен, поэтому вместо этого мы рассматриваем только плотности вероятностей над в этом случае.

f_{X} (x | Y = y) = \frac{P (Y = y | X = x) f_{X} (x)}{p (Y = y)}

$f_X(x|Y=y) = \frac{P(Y=y|X=x)f_X(x)}{p(Y=y)}$

P (X = x | Y = y)

$P(X=x|Y=y)$

X

$X$

Y

$Y$

X

$X$

Редактировать: Из-за путаницы с нотацией (см. Комментарии) вышеизложенное относится к противоположной ситуации, о которой спрашивал пещерный человек.

— Рубен ван Берген
источник

Как определяется когда

Моя попытка