Уведомление после таблицы ANOVA после анализа K-средних указывает на то, что уровни значимости не следует рассматривать как критерий равных средних, поскольку кластерное решение было получено на основе евклидова расстояния для максимизации расстояния. Какой тест я должен использовать, чтобы показать, отличаются ли средства переменных кластеризации между кластерами? Я видел это предупреждение в предоставленной таблице ANOVA для выходов k-средних, но в некоторых ссылках я вижу, что выполняются специальные тесты ANOVA. Должен ли я игнорировать выходные данные ANOVA для k-средних и запускать односторонние ANOVA с помощью специальных тестов и интерпретировать их традиционным способом? Или я могу подразумевать только величину F и какие переменные больше влияют на разницу? Другая путаница заключается в том, что кластеризованные переменные обычно не распределяются в нарушение предположения ANOVA, тогда я мог бы использовать непараметрический критерий Крускала-Уоллиса, но он имеет предположение о тех же распределениях. Межкластерные распределения для конкретных переменных не кажутся одинаковыми, некоторые имеют положительный перекос, некоторые - отрицательный ... У меня 1275 больших выборок, 5 кластеров, 10 кластерных переменных, измеренных в баллах PCA.