Размеры низкоразмерного пространства не имеют смысла. Обратите внимание, что функция потерь t-SNE основана исключительно на расстояниях между точками ( и y j ) и распределениях вероятностей по этим расстояниям ( p i j и q i j ):YяYJпя жQя ж
δСδYя= 4 ∑J( ря ж- дя ж) ( уя- уJ) ( 1 + | | yя- уJ| |2)- 1
Таким образом, нет проекции из всего многомерного пространства в низкоразмерное пространство, t-SNE находит отображение только из определенного набора многомерных точек в конкретный набор низкоразмерных точек. Поскольку нет функции от одного пространства к другому, также нет никакого внутреннего значения осей.
Вещи, которые вы можете себе представить, чтобы проиллюстрировать это:
- Вращение или перемещение многомерного или низкоразмерного пространства не влияет на расстояния между точками. Следовательно, t-SNE не заботится о вращении или перемещении в обоих пространствах. Таким образом, не существует абсолютной интерпретации осей.
- Распределение t-Student имеет толстые хвосты. Это заставляет низкоразмерное представление быть инвариантным к изменениям в точках, которые находятся далеко в многомерном пространстве. Это также приводит к тому, что точки, находящиеся далеко в многомерном пространстве, могут быть достаточно далеко, далеко или действительно далеко в низкоразмерном пространстве. В этом смысле он растягивает определенные части низкоразмерных осей (в любом произвольном направлении).
При этом t-SNE - это, прежде всего, метод визуализации, и его эффективность уменьшения размеров для других целей не очевидна (вероятно, не подходит для кластеризации, выделения признаков или выбора признаков).
Также: бумага .