Анализ латентного класса на самом деле является моделью конечных смесей (см. Здесь ). Основное различие между FMM и другими алгоритмами кластеризации заключается в том, что FMM предлагает вам подход «кластеризация на основе модели», при котором кластеры создаются с использованием вероятностной модели, которая описывает распределение ваших данных. Таким образом, вместо того, чтобы находить кластеры с произвольно выбранной мерой расстояния, вы используете модель, которая описывает распределение ваших данных и на основе этой модели вы оцениваете вероятность того, что определенные случаи являются членами определенных скрытых классов. Таким образом, вы можете сказать, что это нисходящий подход (вы начинаете с описания распределения ваших данных), в то время как другие алгоритмы кластеризации являются скорее восходящими (вы обнаруживаете сходство между случаями).
Потому что вы используете статистическую модель для выбора модели данных, и оценка пригодности возможна - вопреки кластеризации. Кроме того, если вы предполагаете, что существует некоторый процесс или «скрытая структура», которая лежит в основе структуры ваших данных, то FMM кажутся подходящим выбором, поскольку они позволяют вам моделировать скрытую структуру, лежащую в основе ваших данных (а не просто искать сходство).
Другое отличие состоит в том, что FMM более гибкие, чем кластеризация. Алгоритмы кластеризации просто выполняют кластеризацию, в то время как существуют модели на основе FMM и LCA, которые
- позволит вам сделать подтверждающий, межгрупповой анализ,
- объединить модели теории ответа на предмет (и другие) с LCA,
- включить ковариаты для прогнозирования скрытого членства в классе,
- и / или даже внутригрупповые регрессионные модели в регрессии латентного класса ,
- позволяет моделировать изменения во времени в структуре ваших данных и т. д.
Для большего количества примеров смотрите:
Hagenaars JA & McCutcheon, AL (2009). Прикладной анализ латентного класса. Издательство Кембриджского университета.
и документация пакетов flexmix и poLCA на R, включая следующие документы:
Linzer, DA & Lewis, JB (2011). poLCA: пакет R для анализа скрытых классов политомных переменных. Журнал статистического программного обеспечения, 42 (10), 1-29.
Лейш Ф. (2004). Flexmix: общая структура для моделей конечных смесей и регрессии латентного стекла в R. Journal of Statistical Software, 11 (8), 1-18.
Grün B. & Leisch F. (2008). FlexMix версия 2: конечные смеси с сопутствующими переменными и переменными и постоянными параметрами . Журнал статистического программного обеспечения, 28 (4), 1-35.
inferences
в этом контексте и почему вас интересуют только различия в умозаключениях?