Когда использовать байесовские сети поверх других подходов машинного обучения?

12

Я ожидаю, что не может быть никакого определенного ответа на этот вопрос. Но в прошлом я использовал несколько алгоритмов машинного обучения и пытаюсь узнать о байесовских сетях. Я хотел бы понять, при каких обстоятельствах или для каких типов проблем вы бы выбрали использование байесовской сети по сравнению с другими подходами?

machine-learning bayesian-network

— AndyC
источник

3

Для меня байесовские сети - это способ определения условных зависимостей в модели. После того как вы определили это, я думаю, вы можете использовать различные инструменты обучения для оценки параметров модели. Итак, я вижу четкое разделение между параметром обучения и моделью. Тем не менее, я не эксперт в этом, поэтому кто-то может прийти с лучшим ответом.

— Лука

7

$X$ $Y$ $P(X,Y)$ $P(Y|X)$

$P(X_1|Y)$ $P(X_1|X_2=A, X_3=B)$ $P(Y|X)$

BN используют DAG для предписания совместного распространения. Следовательно, они являются графическими моделями.

Преимущества:

Когда у вас много пропущенных данных, например, в медицине, BN могут быть очень эффективными, поскольку моделирование совместного распределения (т. Е. Ваше утверждение о том, как были получены данные) уменьшает вашу зависимость от наличия полностью наблюдаемого набора данных.
$\text{cause} \to \text{effect}$
Изучение совместного распределения является сложной задачей, моделирование его для дискретных переменных (посредством расчета таблиц условной вероятности, то есть СРТ) существенно проще, чем пытаться сделать то же самое для непрерывных переменных. Таким образом, BN практически чаще встречаются с дискретными переменными.
BN позволяют не только сделать вывод о наблюдении (как позволяют все модели машинного обучения), но и причинно-следственные вмешательства . Это обычно пренебрегаемое и недооцениваемое преимущество BN, и оно связано с неэффективными рассуждениями.

— Zhubarb
источник

1

В преимуществе 1, где вы говорите, что BN эффективны для моделирования данных с большим количеством пропущенных значений, не влияют ли эти пропущенные значения на правильную идентификацию независимых данных?

— Хоссейн

1

P (Y, X_{1}, X_{2})

$P(Y,X_1,X_2)$

X_{1}

$X_1$

X_{2}

$X_2$

1

По моему опыту, байесовские сети работают очень хорошо, когда есть данные с высокой размерностью . Они дают интерпретируемые модели, которые (иногда) помогают понять, как взаимодействуют различные переменные.

— загар
источник