R поставляется с большим количеством наборов данных, и, похоже, не составит труда воспроизвести большинство примеров, которые вы привели, с несколькими строками кода. Также может оказаться полезным пакет mlbench , в частности наборы синтетических данных, начиная с mlbench.*
. Некоторые иллюстрации приведены ниже.
Вы найдете дополнительные примеры, посмотрев на представление задач кластера в CRAN. Например, пакет fpc имеет встроенный генератор для кластеризованных наборов эталонных данных «в форме лица» ( rFace
).
Аналогичные соображения применимы к Python, где вы найдете интересные тесты производительности и наборы данных для кластеризации с помощью scikit-learn .
Хранилище машинного обучения UCI также содержит множество наборов данных , но вам лучше смоделировать данные самостоятельно на выбранном вами языке.