Пакеты Python для работы с моделями гауссовых смесей (GMM)


12

Кажется, есть несколько вариантов для работы с моделями гауссовых смесей (GMM) в Python. На первый взгляд есть как минимум:

... и, возможно, другие. Кажется, что все они обеспечивают самые основные потребности в GMM, включая создание и выборку, оценку параметров, кластеризацию и т. Д.

В чем разница между ними, и как следует определить, что лучше всего подходит для конкретной потребности?

Ссылка: http://www.scipy.org/Topical_Software


Вы можете попробовать профилировать действительно простую версию сжатия изображений с использованием GMM. Для данного изображения используйте GMM, чтобы назначить пикселям разные вероятности, а затем воссоздать изображение, используя вероятности в качестве индексов для конкретного гауссиана, из которого, вероятнее всего, пришел конкретный пиксель.
Филлип Облако,

@cpcloud - Вы имеете в виду: настроить упрощенный эксперимент для выполнения в каждом из этих пакетов в качестве точки сравнения? Ну, ладно, но это немало усилий. Я надеюсь на какой-то вклад от людей, которые использовали эти пакеты.
Аман

2
Scikit-learn - это популярная библиотека машинного обучения, которая также имеет некоторую поддержку GMM. Я не уверен, что он соответствует вашим потребностям, но у него есть преимущество наличия других алгоритмов обучения и структуры (например, перекрестная проверка, составление модели).
поразрядно

PyPR и PyEM доступны только для Python 2 и, похоже, не находятся в стадии активной разработки. PyMix выглядит как лучший выбор.
Джош Милторп

Ответы:


3

Я не знаю, как вообще определить, какой из них лучше, но если вы достаточно хорошо знаете настройки своего приложения, вы можете смоделировать данные и попробовать пакеты для этого моделирования. Метриками успеха могут быть время, затрачиваемое на оценку, и качество восстановления моделируемой наземной истины.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.