Является ли направление ребер в байесовской сети нерелевантным?


10

Сегодня на лекции было заявлено, что направление ребер в байесовской сети не имеет большого значения. Они не должны представлять причинность.

Очевидно, что вы не можете переключить ни одного ребра в байесовской сети. Например, пусть с и . Если вы переключите на , то больше не будет ациклическим и, следовательно, не будет байесовской сетью. Кажется, это в основном практическая проблема, как оценить вероятности тогда. На этот случай ответить гораздо сложнее, поэтому я его пропущу.V = { v 1 , v 2 , v 3 } E = { ( v 1 , v 2 ) , ( v 1 , v 3 ) , ( v 2 , v 3 ) } ( v 1 , v 3 ) ( v 3 , v 1 ) GG=(V,E)V={v1,v2,v3}E={(v1,v2),(v1,v3),(v2,v3)}(v1,v3)(v3,v1)G

Это заставило меня задать следующие вопросы, на которые я надеюсь получить ответы здесь:

  1. Возможно ли для любого ориентированного ациклического графа (DAG) обратить все ребра и при этом иметь DAG?
  2. Предположим, DAG и данные даны. Теперь построим обратный DAG . Для обоих DAG мы подгоняем данные к соответствующим байесовским сетям. Теперь у нас есть набор данных, для которых мы хотим использовать байесовскую сеть для прогнозирования недостающих атрибутов. Могут ли быть разные результаты для обоих DAG? (Бонус, если вы придумали пример)G invGGinv
  3. Аналогично 2, но проще: предположим, что DAG и данные даны. Вы можете создать новый граф , перевернув любой набор ребер, если остается ациклическим. Являются ли сети Байеса эквивалентными, когда дело доходит до их прогнозов?G G GGG
  4. Получаем ли мы что-то, если у нас есть ребра, которые представляют причинность?

Ответы:


6

TL; DR: иногда вы можете создать эквивалентную байесовскую сеть, обращая стрелки, а иногда вы не можете.

Простое изменение направления стрелок приводит к другому ориентированному графу, но этот граф не обязательно является графом эквивалентной байесовской сети, поскольку отношения зависимости, представленные графом с обратными стрелками, могут отличаться от отношений, представленных исходным графом. Если график с перевернутыми стрелками представляет отношения зависимости, отличные от исходных, в некоторых случаях можно создать эквивалентную байесовскую сеть, добавив еще несколько стрелок для захвата отношений зависимости, которые отсутствуют на графике перевернутых стрелок. Но в некоторых случаях нет абсолютно эквивалентной байесовской сети. Если вам нужно добавить несколько стрелок, чтобы захватить зависимости,

Например, a -> b -> cпредставляет те же зависимости и независимости a <- b <- c, что и те же, что и a <- b -> c, но не такие, как a -> b <- c. Этот последний график говорит, что aи cявляется независимым, если bне наблюдается, но a <- b -> cговорит aи cзависит в этом случае. Мы можем добавить ребро непосредственно от aк, cчтобы захватить это, но тогда aи cбыть независимым, когда bнаблюдается, не представляется. Это означает, что существует по крайней мере одна факторизация, которую мы не можем использовать при вычислении апостериорных вероятностей.

Все эти вещи о зависимости / независимости, стрелах и их разворотах и ​​т. Д. Описаны в стандартных текстах байесовских сетей. Я могу выкопать некоторые ссылки, если хотите.

Байесовские сети не выражают причинности. Иудея Перл, которая много работала над байесовскими сетями, также работала над тем, что он называет причинно-следственными сетями (по сути, байесовские сети, отмеченные причинно-следственными связями).


Это отвечает на вопросы (2) и (3). У вас есть идеи по поводу вопросов (1) и (4)? (Да, ссылки были бы хорошими)
Мартин Тома

(1) Рассмотрим противоположное: если график с обратными стрелками имеет направленный цикл, то следование за стрелками вокруг цикла в обратном направлении должно быть направленным циклом в исходном графике. (4) Байесовские сети являются вероятностными моделями и как таковые не представляют причинности. Возможно, что некоторые стрелки действительно ссылаются на причинно-следственные связи, но это потеряно в вероятностной модели. Возможно, aпричины b, но a -> bи a <- bодинаково действительны вероятностные модели.
Роберт Додье

Некоторые вводные ссылки. Коллер и Фридман: "Вероятностные графические модели". Коуэлл, Давид, Лауритцен и Шпигельхальтер: «Вероятностные сети и экспертные системы». Кастильо, Гутьеррес и Хади: «Экспертные системы и вероятностные сетевые модели».
Роберт Додье

Вы можете перевернуть любую стрелку и получить эквивалентную байесовскую сеть, пока вы сохраняете v-структуры (не переворачивайте стрелку, на которую другая стрелка также указывает на узел, на который она указывает)
borgr

1

Это может быть немного неудовлетворительно, поэтому не стесняйтесь не принимать этот ответ и заранее извиняюсь.

В байесовской сети узлы представляют случайные величины, а ребра представляют условные зависимости. Когда вы интерпретируете узлы определенным образом, обусловливание течет определенным образом естественным образом. Произвольное их изменение не имеет смысла в контексте моделирования данных. И часто стрелки показывают причинно-следственную связь.


1
Это довольно далеко от цели. «Естественная» интерпретация - это нечто, навязанное модели, она не является частью самой модели. Вы можете отменить зависимости (добавив дополнительные ребра, если необходимо сохранить набор зависимостей, представленных сетью), и это все еще байесовская сеть. Имеет ли это смысл, не несет ответственности, рассматривая только саму сеть. Между прочим, Иудея Перл, одна из главных движущих сил байесовских сетей в 80-х и 90-х годах, в последнее время работает над формальными моделями причинности, которые выражают причинно-следственные связи в модели.
Роберт Додье

Вы говорите: «Имеет ли это смысл, нельзя отчитываться, рассматривая только саму сеть». Я никогда не говорил, что это было. Я сказал: «Когда вы интерпретируете узлы определенным образом, обусловленность течет определенным образом ...» Это, вероятно, отражает мою предвзятость; Вы можете назвать материал, который я работаю, в сети Байеса, но этот вопрос никогда не возникнет для меня. Например, если два узла представляют одну и ту же переменную в разное время, не возникнет вопроса о том, в каком направлении течет кондиционирование. Однако я допускаю возможность того, что есть ситуации, когда люди могут использовать эти сети Байя менее жестким способом.
Тейлор

0

Вопрос 3

synergy.st-andrews.ac.uk/vannesmithlab утверждает, что графики

G1 = o->o->o and
G2 = o<-o->o

находятся в одном классе эквивалентности. Согласно этому источнику, модели представляют собой одно и то же совместное распределение вероятностей.


Это не может быть правдой. Для G1 первое и последнее зависят от отсутствия каких-либо известных значений. Для G2 первое и последнее не зависят от отсутствия каких-либо известных значений. Вы хотели написать G2 = o <- o -> oвместо этого? В любом случае, я не вижу претензий относительно тех конкретных графиков на веб-странице, на которую вы ссылаетесь; возможно, вы можете быть более конкретным.
Роберт Додье
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.