Плюсы дистанции Джеффриса Матуситы


11

Согласно какой-то статье, которую я читаю, расстояние Джеффриса и Матуситы обычно используется. Но я не мог найти много информации об этом, кроме формулы ниже

JMD (x, y) =(xi2yi2)22

Это похоже на евклидово расстояние, за исключением квадратного корня

E (x, y) =(xiyi)22

JM расстояние считается более надежным, чем евклидово расстояние с точки зрения классификации. Кто-нибудь может объяснить, почему эта разница делает расстояние JM лучше?


1
Я не могу найти авторитетную ссылку, которая использует эту формулу для расстояния Джеффриса-Матуситы. Формулы, которые я нахожу, основаны на ковариационных матрицах для двух классов и, по-видимому, не имеют отношения к приведенному здесь, но кажется, что могут быть две (или более) разные вещи, известные под этим именем. Не могли бы вы предоставить ссылку или (еще лучше) ссылку? Кстати, это и рассчитывает на какой -то шанс? (Если так, то есть естественная интерпретация вашей формулы.)xiyi
whuber

1
@whuber: может быть, и являются стоять в течение иxyp(x)q(x)
user603

@ user603 Да, я думаю, ты понял. Теперь связь с расхождениями KL и мерой Баттачарья становится очевидной.
whuber

Ответы:


14

Некоторые ключевые отличия, предшествующие более подробному объяснению ниже, заключаются в том, что:

  1. Важно отметить, что расстояние Джеффриса-Матуситы относится к распределениям, а не к векторам в целом.
  2. Формула расстояния JM, которую вы цитируете выше, применима только к векторам, представляющим дискретные распределения вероятностей (т.е. к векторам, сумма которых равна 1).
  3. В отличие от евклидова расстояния, расстояние JM может быть обобщено на любые распределения, для которых можно сформулировать расстояние Бхаттачарры.
  4. Расстояние JM, через расстояние Bhattacharrya, имеет вероятностную интерпретацию.

Расстояние Джеффриса-Матуситы, которое, по-видимому, особенно популярно в литературе по дистанционному зондированию, представляет собой преобразование расстояния Бхаттачаррии (популярный показатель различия между двумя распределениями, обозначаемый здесь как ) из диапазона к фиксированному диапазону :bp,q[0,inf)[0,2]

JMp,q=2(1exp(b(p,q))

Согласно этой статье практическое преимущество расстояния JM состоит в том, что эта мера "имеет тенденцию подавлять высокие значения отделимости, в то же время переоценивая низкие значения отделимости".

Расстояние Бхаттачарры измеряет различие двух распределений и в следующем абстрактном непрерывном смысле: если распределения и захвачены гистограммами, представленными векторами длины единицы (где й элемент является нормализованным числом для го из бинов), это становится: И, следовательно, расстояние JM для двух гистограмм: Что, учитывая, что для нормализованных гистограммpq

b(p,q)=lnp(x)q(x)dx
pqiiN
b(p,q)=lni=1Npiqi
JMp,q=2(1i=1Npiqi)
ipi=1, совпадает с формулой, которую вы дали выше:
JMp,q=i=1N(piqi)2=i=1N(pi2piqi+qi)=2(1i=1Npiqi)

+1 Большое спасибо за то, что прыгнули и сделали это очень хорошо сделанное усилие, чтобы прояснить ситуацию.
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.