Каково обоснование ковариационной функции Матерна?


19

Ковариационная функция Матерна обычно используется в качестве функции ядра в гауссовском процессе. Определяется так

Cν(d)=σ221νΓ(ν)(2νdρ)νKν(2νdρ)

где d - функция расстояния (например, евклидово расстояние), Γ - гамма-функция, Kν - модифицированная функция Бесселя второго рода, ρ и ν - положительные параметры. ν много времени выбрано, чтобы быть 32 или52 на практике.

Много раз это ядро ​​работает лучше, чем стандартное ядро ​​Гаусса, поскольку оно «менее гладкое», но, кроме этого, есть ли другие причины, по которым можно предпочесть это ядро? Высоко ценится некоторая геометрическая интуиция о том, как она себя ведет, или какое-то объяснение, казалось бы, загадочной формулы.

Ответы:


18

В дополнение к хорошему ответу @DahnJahn, я подумал, что постараюсь рассказать немного больше о том, откуда берутся функции Бесселя и гамма. Одной из отправных точек для достижения ковариационной функции является теорема Бохнера.

Теорема (Бохнер) Непрерывная стационарная функция k(x,y)=k~(|xy|) положительно определена тогда и только тогда , когда k~ является преобразованием Фурье конечной положительной меры:

k~(t)=Reiωtdµ(ω)

Из этого можно сделать вывод, что ковариационная матрица Матерна выводится как преобразование Фурье 1(1+ω2)p (Источник). Это все хорошо, но это на самом деле не говорит нам, как вы пришли к этой конечной положительной мере, заданной1(1+ω2)p . Ну, это спектральная плотность (мощности) случайного процессаf(x).

Какой случайный процесс? Известно, что случайный процесс на Rd с ковариационной функцией Матерна является решением стохастического уравнения в частных производных (SPDE)

(κ2)α/2X(s)=φW(s),
где W(s) - гауссовский белый шум с единичной дисперсией,
Δ=i=1d2xi2
- оператор Лапласа, аα=ν+d/2(я думаю, что это вКресси и Викле).

Зачем выбирать именно этот SPDE / стохастический процесс? Источник в пространственной статистике, где утверждается, что это самая простая и естественная ковариация, которая хорошо работает в R2 :

Экспоненциальная корреляционная функция является естественной корреляцией в одном измерении, поскольку она соответствует марковскому процессу. В двух измерениях это уже не так, хотя экспонента является общей корреляционной функцией в геостатистических работах. Уиттл (1954) определил соотношение, соответствующее стохастическому дифференциальному уравнению типа Лапласа:

гдеϵ- белый шум. Соответствующий дискретный процесс решетки является авторегрессией второго порядка. (Источник)

[(t1)2+(t2)2κ2]X(t1,t2)=ϵ(t1,t2)
ϵ

Семейство процессов , включенных в СДУ , связанный с уравнением Matern включает Орнштейн-Уленбек модель скорости частицы , подвергающуюся броуновское движение. В более общем смысле вы можете определить спектр мощности для семейства процессов A R ( p ) для каждого целого числа p, которое также имеет ковариацию семейства Матерна. Это в приложении Расмуссена и Уильямса.AR(1)AR(p)p

Эта ковариационная функция не связана с кластерным процессом Матерна.

Ссылки

Кресси, Ноэль и Кристофер К. Уикл. Статистика пространственно-временных данных. John Wiley & Sons, 2015.

Гутторп, Питер и Тильманн Гнейтинг. «Исследования по истории вероятностей и статистики XLIX о корреляции семейства Matern». Биометрика 93,4 (2006): 989-995.

Расмуссен, CE и Уильямс, CKI Гауссовские процессы для машинного обучения. MIT Press, 2006.


2
В одномерном случае, Matern ковариационная с формой с р положительное целое число является то , что в непрерывном времени процесса авторегрессии CAR ( р ) порядка р . Однако не все модели CAR ( p ) имеют Matern-ковариацию. ν=p1/2pCAR(p)pCAR(p)
Ив

Это очевидное недоразумение с моей стороны, я обновлю ответ. Спасибо!
MachineEpsilon

16

Я не знаю, но я нашел этот вопрос очень интересным, и вот что я получил после небольшого прочтения.

Для некоторых значений ковариационная функция Матерна может быть выражена как произведение экспоненты и многочлена. Например , для v , = 5 / 2 : C 5 / 2 ( г ) = σ 2 ( 1 + νν=5/2 Тогда не удивительночто, какN,Cvсобственно сходится кгауссовой RBF: ПтNСN(d)=σ2ехр(-d2

C5/2(d)=σ2(1+5dρ+5d23ρ2)exp(5dρ)
νCν Дляv=1/2, корреляционная функция Matern дает Абсолютному экспоненциальному ядро C1/2(д)=σ2ехр(-D
limνCν(d)=σ2exp(d22ρ2)
ν=1/2
C1/2(d)=σ2exp(dρ)

νν1

Это довольно хорошо продемонстрировано на снимке, сделанном Rasmussen & Williams (2006) C. E. Rasmussen & C. K. I. Williams, Gaussian Processes for Machine Learning, the MIT Press, 2006,ISBN 026218253X. c 2006 Massachusetts Institute of Technology. www.GaussianProcess.org/gpml

В « Интерполяции пространственных данных» Стейн (который фактически предложил название ковариационной функции Матерна) утверждает (стр. 30), что бесконечная дифференцируемость гауссовой ковариационной функции дает нереалистичные результаты для физических процессов, поскольку наблюдается только небольшая непрерывная дробь Пространство / время должны теоретически дать целую функцию. Таким образом, он предложил версию Matérn как обобщение, способное более реалистично сопоставлять физические процессы.

Резюме

ν

ν


1
(+1) Мне было любопытно, было ли объяснение или вывод этой ковариационной функции в книге Матерна pub.epsilon.slu.se/10033/1/… ? Я не смог найти его до сих пор. Похоже, что эта ковариационная функция занимает видное место в книге Стейна, поэтому я хочу знать больше.
MachineEpsilon

@Machineepsilon каждый из них на самом деле упоминает / определяет функцию? Из книги Штейна я почувствовал, что именно он придумал ее и назвал только в честь Матерна.
Дан

Я не уверен, это то, что я хотел узнать! Я попытаюсь взглянуть, потому что Расмуссен также ссылается на книгу.
MachineEpsilon
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.