Я работал над новым методом анализа и анализа наборов данных, чтобы идентифицировать и изолировать подгруппы населения без предварительного знания характеристик какой-либо подгруппы. Хотя этот метод достаточно хорошо работает с искусственными выборками данных (то есть наборами данных, созданными специально для идентификации и разделения подмножеств населения), я хотел бы попробовать протестировать его с живыми данными.
То, что я ищу, это свободно доступный (т.е. не конфиденциальный, не проприетарный) источник данных. Предпочтительно тот, который содержит бимодальные или мультимодальные распределения или, очевидно, состоит из множества подмножеств, которые нельзя легко разделить традиционными способами. Куда мне пойти, чтобы найти такую информацию?