Почему люди используют термин «вес доказательств» и чем он отличается от «точечной взаимной информации»?

Здесь «вес доказательств» (WOE) - это общий термин в опубликованной научной и политической литературе, чаще всего встречающийся в контексте оценки риска, определяемый как:

вес (е : час) знак равно журнал \frac{п (е | час)}{п (е | \bar{час})}

$w(e : h) = \log\frac{p(e|h)}{p(e|\overline{h})}$

где - доказательство, - гипотеза. $e$ $h$

Теперь я хочу знать, в чем главное отличие PMI (точечная взаимная информация).

p m i (e, h) = \log \frac{p (e, h)}{p (e) * p (h)}

$pmi(e,h)=\log\frac{p(e,h)}{p(e)*p(h)}$

probability bayesian mutual-information

— Чарли Эппс
источник

Я считаю, что термин был придуман в этой статье: projecteuclid.org/…

— JohnRos

@JohnRos: Хотя это интересная статья, концептуальный вес доказательств там не назван. У И.Дж. Гуда есть книга, напечатанная в 1950 году, и он говорит, что изучил эту концепцию у самого Тьюринга в Блетчли Парк!

— kjetil b halvorsen

Обратите внимание, что горе, как определено здесь, является просто логарифмическим отношением правдоподобия. Многие упоминания об этом на этом сайте - это другая концепция, см. Stats.stackexchange.com/questions/462052/…

— kjetil b halvorsen

Несмотря на то, что они похожи, они совершенно разные вещи. Давайте начнем с основных отличий.

- что-то другое в PMI и в WOE $h$
Обратите внимание на термин в PMI. Это означает, что является случайной величиной, из которой вы можете вычислить вероятность. Для байесовской системы это не проблема, но если вы не верите, что гипотеза может иметь вероятностьаприори,вы даже не можете написать PMI для гипотезы и доказательства. В WOE является параметром распределения, а выражения всегда определены. $p(h)$ $h$ $h$
PMI симметричен, WOE
нетривиально, . Однако не нужно определять из-за термина . Даже если это так, оно обычно не равно $pmi(e,h) = pmi(h,e)$ $w(h:e) = \log p(h|e)/p(h|\bar{e})$ $\bar{e}$ . $w(e:h)$

Кроме этого, WOE и PMI имеют сходство.

Вес доказательств говорит о том, сколько доказательств говорит в пользу гипотезы. Если это 0, это означает, что он не говорит ни за, ни против. Чем она выше, тем больше она подтверждает гипотезу , и чем она ниже, тем больше она проверяет . $h$ $\bar{h}$

Взаимная информация количественно определяет, как возникновение события ( или ) что-то говорит о возникновении другого события. Если это 0, события независимы, и возникновение одного ничего не говорит о другом. Чем выше, тем чаще они встречаются, и чем ниже, тем больше они взаимоисключающие. $e$ $h$

Как насчет случаев, когда гипотеза также является случайной величиной, и оба варианта верны? К примеру , в communiction над бинарным каналом с шумом, гипотеза излучаемым сигнал для декодирования и доказательство принимаемого сигнала. Скажем , что вероятность переворачивания составляет , так что если вы получаете $h$ $h$ $1/1000$ , то WOE для является . PMI, с другой стороны, зависит от вероятности испускания . Вы можете проверить, что когда вероятность испускания стремится к 0, PMI стремится к $1$ $1$ $\log 0.999/0.001 = 6.90$ $1$ $1$ $6.90$ в то время как он стремится к когда вероятность испускания стремится к . $0$ $1$ $1$

Это парадоксальное поведение иллюстрирует две вещи:

Ни один из них не подходит, чтобы сделать предположение об эмиссии. Если вероятность испускания падает ниже , тоскорее всегоизлучение даже при получении . Однако для малых вероятностей испускания и WOE, и PMI близки к . $1$ $1/1000$ $0$ $1$ $1$ $6.90$
PMI - это получение информации (Шеннона) над реализацией гипотезы, если гипотеза почти уверена, то никакой информации не получается. WOE - это обновление наших предыдущих коэффициентов , которое не зависит от значения этих коэффициентов.

— gui11aume
источник

Это может быть нотацией, но в WMI, как вы определяете

без определения

? Вы не собираетесь с

p (e | h)

$p(e|h)$

p (h)

$p(h)$

p (e | h) = \frac{p (e, h)}{p (h)}

$p(e|h) = \frac{p(e,h)}{p(h)}$

h

$h$

p (e | h)

$p(e|h)$

p (h)

$p(h)$