Каково обоснование, если таковое имеется, использования Дискриминантного анализа (DA) на результатах алгоритма кластеризации, такого как k-средних, как я вижу это время от времени в литературе (по существу, о клинических подтипах психических расстройств)?
Как правило, не рекомендуется проверять групповые различия по переменным, которые использовались во время построения кластера, поскольку они поддерживают максимизацию (соответственно минимизацию) инерции между классами (соответственно внутри класса). Таким образом, я не уверен, что в полной мере оценю добавленную стоимость прогностического DA, если только мы не попытаемся встроить индивидов в факториальное пространство более низкого измерения и получить представление о «обобщенности» такого разбиения. Но даже в этом случае кластерный анализ остается принципиально исследовательским инструментом, поэтому использование членства в классе, рассчитанного таким образом для дальнейшего получения правила подсчета очков, на первый взгляд кажется странным.
Любые рекомендации, идеи или указатели на соответствующие документы?
R
: cran.r-project.org/web/packages/adegenet/vignettes/…