Я процитирую часто задаваемые вопросы от вебсайта t-SNE . Первый за недоумение:
Как я должен установить недоумение в t-SNE?
Производительность t-SNE довольно устойчива при различных настройках сложности. Наиболее подходящее значение зависит от плотности ваших данных. Грубо говоря, можно сказать, что больший / более плотный набор данных требует большего недоумения. Типичные значения недоумения колеблются от 5 до 50.
Для всех других параметров я хотел бы прочитать это:
Как я могу оценить качество визуализаций, созданных t-SNE?
Желательно просто посмотреть на них! Обратите внимание, что t-SNE сохраняет не расстояния, а вероятности, поэтому измерение некоторой ошибки между евклидовыми расстояниями в высоком и низком D бесполезно. Однако, если вы используете те же данные и недоумение, вы можете сравнить расхождения Kullback-Leibler, о которых сообщает t-SNE. Совершенно нормально запускать t-SNE десять раз и выбирать решение с самой низкой дивергенцией KL.
Другими словами это означает: посмотрите на график, если визуализация хорошая, не меняйте параметры. Вы также можете выбрать прогон с наименьшей дивергенцией KL для каждого фиксированного недоумения.