Я исследовал k-means, и вот что я получил: k-means - это один из самых простых алгоритмов, который использует неконтролируемый метод обучения для решения известных проблем кластеризации. Это работает очень хорошо с большими наборами данных.
Однако есть и недостатки K-Means, которые:
- Сильная чувствительность к выбросам и шуму
- Не очень хорошо работает с некруглой формой кластера - номер кластера и начальное начальное значение необходимо указать заранее
- Низкая способность пройти локальный оптимум.
Есть ли что-то великое в k-средних, потому что кажется, что недостатки за пределами хороших вещей в k-средних.
Пожалуйста, научите меня.