R поставляется с большим количеством наборов данных, и, похоже, не составит труда воспроизвести большинство примеров, которые вы привели, с несколькими строками кода. Также может оказаться полезным пакет mlbench , в частности наборы синтетических данных, начиная с mlbench.*
. Некоторые иллюстрации приведены ниже.
![введите описание изображения здесь](https://i.stack.imgur.com/HW3hH.png)
Вы найдете дополнительные примеры, посмотрев на представление задач кластера в CRAN. Например, пакет fpc имеет встроенный генератор для кластеризованных наборов эталонных данных «в форме лица» ( rFace
).
![введите описание изображения здесь](https://i.stack.imgur.com/AnIex.png)
Аналогичные соображения применимы к Python, где вы найдете интересные тесты производительности и наборы данных для кластеризации с помощью scikit-learn .
Хранилище машинного обучения UCI также содержит множество наборов данных , но вам лучше смоделировать данные самостоятельно на выбранном вами языке.