Преобразование матрицы подобия в (евклидову) матрицу расстояний


27

В алгоритме «Случайный лес» Брейман (автор) строит матрицу подобия следующим образом:

  1. Посылайте все учебные примеры по каждому дереву в лесу

  2. Если два примера попадают в один и тот же лист, увеличивайте соответствующий элемент в матрице подобия на 1

  3. Нормализовать матрицу количеством деревьев

Он говорит:

Близость между случаями n и k образует матрицу {prox (n, k)}. Из их определения легко показать, что эта матрица симметрична, положительно определена и ограничена сверху 1, с диагональными элементами, равными 1. Из этого следует, что значения 1-prox (n, k) являются квадратами расстояний в евклидовом Пространство измерения не больше, чем количество случаев. Источник

В своей реализации он использует sqrt (1-prox) , где prox - матрица подобия, чтобы преобразовать ее в матрицу расстояний. Я думаю, это как-то связано с «квадратными расстояниями в евклидовом пространстве», приведенными выше.

Может ли кто-то пролить немного света на то, почему из 1-прокс в квадрате евклидова пространства возводятся квадратные расстояния, и почему он использует квадратный корень для получения матрицы расстояний?

Ответы:


30

введите описание изображения здесь

d122знак равночас12+час22-2час1час2созφчас12час22час1час2созφ (= скалярное произведение, = скалярное произведение) векторов 1 и 2.

Скалярное произведение также называют угловым подобием между 1 и 2, и в евклидовом пространстве это геометрически наиболее достоверная мера подобия , потому что оно легко преобразуется в евклидово расстояние и наоборот (см. Также здесь ).

час2созφрσ1σ2р12предметное пространство "способ представления. Теорема косинуса остается верной независимо от того, что принято считать" векторами "в данном случае - точки данных или особенности данных.]

часsd2знак равно2(1-s)d2d2знак равно1-sрр

ssчасd

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.