Когда использовать модель гауссовой смеси?


9

Я новичок в использовании GMM. Я не смог найти подходящей помощи онлайн. Может ли кто-нибудь предоставить мне правильный ресурс "Как решить, подходит ли использование GMM для моей проблемы?" или в случае проблем классификации "Как решить, должен ли я использовать классификацию SVM или классификацию GMM?"


что такое ваш набор данных и в чем ваша проблема? Используется, когда данные следуют (представляют собой смесь) более 1 нормального распределения. Смотрите другой вопрос - stats.stackexchange.com/questions/236295/…
Арпит Сисодиа

Вы можете думать об этом как о форме кластеризации, когда у вас нет помеченных данных, и вы считаете, что скрытые группировки совершенно нормальны.
gung - Восстановить Монику

@ arpit-sisodia, мы работаем над осуществлением установки аппаратной клавиатуры, которая, кажется, имеет специфические особенности, и мы планируем смоделировать ее с помощью GMM. Мы не знаем четко основной процесс и, следовательно, мы пытаемся моделировать, используя методы машинного обучения. Таким образом, мы не уверены, есть ли на самом деле смесь гауссиан в базовом процессе. Более того, он многомерен, и мы не можем его визуализировать, чтобы увидеть, является ли он смесью гауссов
Vinay

@ arpit-sisodia, ссылка, которую вы предоставили, предлагает больше методов проб и ошибок, чтобы проверить, подходит ли GMM моим данным. Есть ли окончательный способ / правило большого пальца, чтобы выбрать модели для использования. Метод проб и ошибок игры с большим количеством миксов может соответствовать моим данным. Но есть ли определенный способ принять решение? Как будто нам нужна линейная разделимость данных для классификации SVM
Vinay

Ответы:


4

На мой взгляд, вы можете выполнить GMM, когда знаете, что точки данных представляют собой смеси гауссовского распределения. В основном формируются кластеры с различным средним и стандартным отклонением. На сайте scikit-learn есть хорошая диаграмма. L

GMM классификация

Подход состоит в том, чтобы найти кластеры, используя мягкие методы кластеризации, а затем посмотреть, являются ли они гауссовскими. Если это так, то вы можете применить модель GMM, которая представляет весь набор данных.


1
часто мы не знаем, являются ли точки данных смесью гауссианов. Итак, это больше тренировка с Gaussian и MoG и посмотреть, подходит ли она. Но нет никаких указаний / правил большого пальца, чтобы использовать GMM правильно
Vinay

2
Согласно моему опыту, вам нужно найти образец в данных, что это модель Mixture. Хорошая статья для чтения была бы такой: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer

0

GMM обычно являются хорошим местом для начала, если ваша цель состоит в том, чтобы (1) кластеризовать наблюдения, (2) указать генеративную модель или (3) оценить плотности. Фактически, для кластеризации GMM представляют собой расширенный набор k-средних.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.