Расстояние движителя земли можно записать как E M D( P, Q ) = инф E∥ X- Y∥ , где инфимум берется по всем совместным распределениям Икс и Y с маргинальными Икс∼ P , Y∼ Q . Это также известно как первое расстояние Вассерштейна , которое равно Wп= inf ( E∥ X- Y∥п)1 / р с тем же инфимумом.
Пусть Икс∼ P= N( μИкс, ΣИкс) , Y∼ Q = N( μY, ΣY) .
Нижняя граница: по неравенству Дженсена, так как нормы выпуклые,
Е∥ X- Y∥ ≥ ∥ E( X- Y) ∥ = ∥ μИкс- μY∥ ,
поэтому EMD всегда по крайней мере, расстояние между средствами (для любых распределений).
Верхняя граница, основанная на W2 :
опять же из-за неравенства Дженсена
( E∥ X- Y∥ )2≤ E∥ X- Y∥2 . Таким образом, W1≤ W2 . Но Доусон и Ландау (1982) устанавливают, что
W2( P, Q )2= ∥ μИкс- μY∥2+ т р( ΣИкс+ ΣY- 2 ( ΣИксΣY)1/2),
давая верхнюю границу EMD=W1 .
Более жесткая верхняя граница:
рассмотрим соединение
Это карта, полученная Ноттом и Смитом (1984) , Об оптимальном отображении распределений , Журнал теории оптимизации и приложений, 43 (1) С. 39-49 как оптимальное отображение для ; см. также этот блог . Обратите внимание, что и
XY∼N(μx,Σx)=μy+Σ−12x(Σ12xΣyΣ12x)12Σ−12xA(X−μx).
W2A = ATЕYVarY= μY+ A ( EИкс- μИкс) = μY= A ΣИксAT= Σ- 12Икс( Σ12ИксΣYΣ12Икс)12Σ- 12ИксΣИксΣ- 12Икс( Σ12ИксΣYΣ12Икс)12Σ- 12Икс= Σ- 12Икс( Σ12ИксΣYΣ12Икс) Σ- 12Икс= ΣY,
поэтому связь действительна.
Расстояние тогда равно , где теперь
что нормально с
∥ X- Y∥∥ D ∥D= X- Y= X- μY- А ( Х- μИкс)= ( Я- А ) Х- μY+ A μИкс,
ЕDVarD= μИкс- μY= ( Я- А ) ΣИкс( Я- а )T= ΣИкс+ A ΣИксA - A ΣИкс- ΣИксA= ΣИкс+ ΣY- Σ- 12Икс( Σ12ИксΣYΣ12Икс)12Σ12Икс- Σ12Икс( Σ12ИксΣYΣ12Икс)12Σ- 12Икс,
Таким образом, верхняя оценка для равна . К сожалению, закрытую форму для этого ожидания удивительно неприятно записать для общих многомерных нормалей: см. Этот вопрос , а также этот .W1( P, Q )Е∥ D ∥
Если дисперсия оказывается сферической (например, если , , то дисперсия становится ), прежняя Вопрос дает ответ в терминах обобщенного полинома Лагерра.DΣИкс= σ2ИксяΣY= σ2YяD( σИкс- σY)2я
В общем, у нас есть простая верхняя оценка для основанная на неравенстве Дженсена, полученная, например, из первого вопроса:
Е∥ D ∥( E∥ D ∥ )2≤ E∥ D ∥2= ∥ μИкс- μY∥2+ т р( ΣИкс+ ΣY- A ΣИкс- ΣИксА )= ∥ μИкс- μY∥2+ т р( ΣИкс) + t r( ΣY) -2 т р( Σ- 12Икс( Σ12ИксΣYΣ12Икс)12Σ12Икс)= ∥ μИкс- μY∥2+ т р( ΣИкс) + t r( ΣY) -2 т р( ( Σ12ИксΣYΣ12Икс)12)= W2( P, Q )2,
Равенство в конце объясняется тем, что матрицы и похожи Таким образом, они имеют одинаковые собственные значения, и, следовательно, их квадратные корни имеют одинаковый след.ΣИксΣYΣ12ИксΣYΣ12Икс= Σ- 12Икс( ΣИксΣY) Σ12Икс
Это неравенство является строгим до тех пор, пока не вырожден, что в большинстве случаев имеет место .∥ D ∥ΣИкс≠ ЕY
Гипотеза : может быть, эта более близкая верхняя граница, , является жесткой. С другой стороны, у меня в течение долгого времени была другая верхняя граница, которую я предположил, чтобы быть жесткой, которая на самом деле была более слабой, чем , так что, возможно, вам не следует слишком сильно доверять этой гипотезе. :)Е∥D∥W2