На самом деле нет ответа. Это где-то между 1 и N.
Тем не менее, вы можете думать об этом с точки зрения прибыли.
Например, в маркетинге используется сегментация, которая очень похожа на кластеризацию.
Сообщение (скажем, реклама или письмо), предназначенное для каждого человека, будет иметь самый высокий уровень ответа. Общее сообщение, адаптированное к среднему значению, будет иметь самый низкий уровень ответа. Скажем, три сообщения, предназначенные для трех сегментов, будут где-то посередине. Это сторона дохода.
Сообщение, предназначенное для каждого человека, будет иметь самую высокую стоимость. Общее сообщение с учетом среднего будет иметь самую низкую стоимость. Три сообщения, предназначенные для трех сегментов, будут где-то посередине.
Скажем, оплата автора за написание собственного сообщения стоит 1000, два - 2000 и так далее.
Скажем, используя одно сообщение, ваш доход составит 5000. Если вы разделили своих клиентов на 2 сегмента и написали индивидуальные сообщения для каждого сегмента, ваш ответ будет выше. Скажем, выручка составляет 7500. С тремя сегментами, немного более высоким уровнем отклика, а ваши доходы - 9000. Еще один сегмент, и вы на 9500.
Чтобы максимизировать прибыль, продолжайте сегментирование до тех пор, пока предельный доход от сегментирования не будет равен предельным издержкам сегментирования. В этом примере вы будете использовать три сегмента для максимизации прибыли.
Segments Revenue Cost Profit
1 5000 1000 4000
2 7500 2000 5500
3 9000 3000 6000
4 9500 4000 5500
hopack
(и другие), которые могут оценить количество кластеров, но это не отвечает на ваш вопрос.