Теорема Мерсера работает наоборот?

У коллеги есть функция и для наших целей это черный ящик. Функция измеряет сходство двух объектов. $s$ $s(a,b)$

Мы точно знаем, что обладает следующими свойствами: $s$

Значения сходства представляют собой действительные числа от 0 до 1 включительно.
Только объекты, которые являются идентичными, имеют баллы 1. Таким образом, подразумевает , и наоборот. $s(a,b)=1$ $a=b$
Мы гарантируем, что . $s(a,b) = s(b,a)$

Теперь он хочет работать с алгоритмами, которые требуют расстояния в качестве входных данных и зависят от входных данных, удовлетворяющих аксиомам расстояния.

Я думал, что мы можем рассматривать оценки подобия так, как если бы они были результатом ядра RBF на некотором расстоянии (это может быть евклидова норма или другое расстояние), то есть мы можем просто переставить алгебру и предположить, что оценки сходства относятся к ядро RBF для пары точек в некоторой (неизвестной) системе координат.

\begin{aligned} s (x_{i}, x_{j}) & = \exp (- \frac{d (m_{i}, m_{j})^{2}}{r}) \\ \sqrt{- r \log s (x_{i}, x_{j})} & = d (m_{i}, m_{j}) \end{aligned}

$\begin{align} s(x_i,x_j) &= \exp\left(-\frac{d( m_i, m_j)^2}{r}\right) \\ \sqrt{-r \log s(x_i,x_j) } &= d(m_i,m_j) \\ \end{align}$

Где - некоторый неизвестный вектор, а - интересующий объект, а - некоторое расстояние. $m_\alpha \in \mathbb{R}^n$ $x_\alpha$ $d$

Очевидные свойства работают с точки зрения соблюдения аксиом расстояния. Результаты должны быть неотрицательными, а расстояния равны 0 для идентичных объектов. Но не очевидно, что этого довольно общего набора обстоятельств достаточно, чтобы подразумевать, что неравенство треугольника соблюдается.

С другой стороны, это звучит как-то безумно.

$f$ $f(s(a,b))=d(a,b)$ $d$ $s$ $f$

$f$ $s$ $f$

— Sycorax говорит восстановить Монику
источник

d (a, b)

$d(a,b)$

Это очень интересная тема! Спасибо, что поделились этим. Я не собирался ограничивать себя определенной дистанцией. (Поскольку, двигаясь в противоположном направлении, можно использовать ядро RBF с неевклидовым расстоянием.)

— Сикоракс говорит, что восстановите Монику

s (a, b)

$s(a,b)$

d (a, b) = f (s (a, b))

$d(a,b)=f(s(a,b))$

d

$d$

s

$s$

s

$s$

f : f (x) = I_{x > 0}

$f: f(x) = I_{x>0}$

Ответы:

Теорема Мерсера работает наоборот?

Не во всех случаях.

Wikipedia: «В математике, в частности , функционального анализа, теорема Мерсера является представление о симметричной положительно определенной функции на площади в виде суммы сходящейся последовательности функций продукта Эта теорема, представленная в (Mercer 1909), является одним из. Наиболее заметные результаты работы Джеймса Мерсера. Это важный теоретический инструмент в теории интегральных уравнений, он используется в теории случайных процессов в гильбертовом пространстве, например теорема Кархунена – Лоэва, а также для характеристики симметричное положительное полуопределенное ядро.

Это отображение « много к одному » в гильбертовом пространстве . - грубое упрощение будет означать, что его описывают как хэш или контрольную сумму, которую вы можете проверить по файлу для определения личности или нет.

Более техническое объяснение: теорема дезинтеграции

«В математике теорема дезинтеграции является результатом теории меры и теории вероятностей. Она строго определяет идею нетривиального« ограничения »меры на подмножество мер ноль рассматриваемого пространства мер. Это связано с Существование условных вероятностных мер. В некотором смысле, «дезинтеграция» является процессом, противоположным построению меры продукта ».

См. Также: « Теорема Фубини – Тонелли », « Потеря шарнира », « Функция потери » и « Насколько хорошо ядро, когда оно используется в качестве меры сходства? » (Июнь 2007 г.), Натан Сребро, аннотация:

« Аннотация. Недавно Балкан и Блум предложили теорию обучения, основанную на общих функциях подобия, вместо положительных полуопределенных ядер. Мы изучаем разрыв между гарантиями обучения, основанными на обучении на основе ядра, и теми, которые можно получить с помощью ядро как функция подобия, которое было оставлено открытым Балканом и Блумом. Мы даем значительно улучшенную оценку того, насколько хороша функция ядра, когда используется как функция подобия, и распространяем результат также на более практически значимую потерю шарнира, а не затем нулевая частота ошибок. Кроме того, мы показываем, что эта граница жесткая, и, следовательно, устанавливаем, что на самом деле существует реальный разрыв между традиционным основанным на ядре понятием маржи и более новым понятием, основанным на подобии. "

$s$

Смотрите: ядра и сходства (в R)

Это черный ящик, поэтому вы не знаете наверняка, какое ядро используется, если оно основано на ядре, и вы не узнаете подробности реализации ядра, если думаете, что оно какое. Смотрите: Уравнение rbfKernel в kernlab отличается от стандартного? ,

С другой стороны, это звучит как-то безумно.

Это быстро и эффективно при ограниченных обстоятельствах. Как молоток, если ты несешь с собой молоток, люди будут называть тебя сумасшедшим?

« Методы ядра обязаны своим именем использованию функций ядра, которые позволяют им работать в многомерном неявном пространстве признаков, даже не вычисляя координаты данных в этом пространстве, а просто вычисляя внутренние произведения между изображениями. всех пар данных в пространстве признаков. Эта операция часто в вычислительном отношении обходится дешевле, чем явное вычисление координат. Этот подход называется «уловкой ядра». Функции ядра были введены для данных последовательности, графиков, текста, изображений, как ну как векторы .

Урок: Вы (иногда) получаете то, за что платите.

$f$ $f(s(a,b))=d(a,b)$ $d$ $s$ $f$

Многие, см. Ссылки выше, « Популярные функции ядра », RBF , и вот один (дорогой) пример: « Мера расстояния отношения правдоподобия для подобия между преобразованием Фурье временных рядов » (2005), Janacek, Bagnall и Powell.

$f$ $s$ $f$

Различные пространства и методы могут лучше нацеливаться на сравнение (и дезинтеграцию) конкретных проблем, существует много методов только для гильбертова пространства .

Да, список большой, см. Ссылки выше и (для одного примера): Воспроизведение ядра Гильберта .

— обкрадывать
источник

-1

Но не очевидно, что этого довольно общего набора обстоятельств достаточно, чтобы подразумевать, что неравенство треугольника соблюдается.

$d(a, b) = 1 - s(a, b)$ $x, y, z$ $d(x, y) = \frac{1}{3}$ $d(y, z) = \frac{1}{3}$ $d(x, z) = 1$ $d(x, z) > d(x, y) + d(y, z)$

— Kodiologist
источник

Я не вижу, как это доказывает что-либо.

— говорит амеба, восстанови Монику

d

$d$

f (α) = 1 - α

$f(\alpha)=1-\alpha$

s

$s$

f

$f$

d

$d$

f

$f$

m

$m$

s

$s$

d

$d$

f

$f$

m

$m$

1 - s (a, b)

$1-s(a,b)$

x_{α}

$x_\alpha$

m_{α}

$m_\alpha$

s

$s$