Я хочу кластеризовать ~ 22000 баллов. Многие алгоритмы кластеризации работают лучше при более высоком качестве начальных догадок. Какие существуют инструменты, которые могут дать мне хорошее представление о приблизительной форме данных?
Я действительно хочу иметь возможность выбирать свою собственную метрику расстояния, поэтому программа, в которую я могу подать список попарных расстояний, была бы просто идеальной. Я хотел бы иметь возможность сделать что-то вроде выделения области или кластера на дисплее и получить список точек данных в этой области.
Свободное программное обеспечение предпочтительнее, но у меня уже есть SAS и MATLAB.