Давайте возьмем стохастическое дифференциальное уравнение:
ИксT= ф( т ,ИксT) гт + г( т ,ИксT) гWT
Вот несколько различных аргументов, которые приводят к интуитивному пониманию того, почему математика, лежащая в основе методов более высокого порядка, необходима. Я буду обсуждать с точки зрения сильного порядка, что то же самое, что сказать "для данного броуновского движенияW( т )Насколько хорошо числовой интеграл решает эту траекторию? "
Регулярность уравнения
Прежде всего, ваш предложенный метод не учитывает тот факт, что ИксTне является непрерывно дифференцируемой На самом деле вы можете использовать результаты Росслера, чтобы показать, что расширение обычных методов RK, как вы предлагали, приведет к конвергентным методам, но они будут иметь только сильный порядок 0,5. Причина в том, что они были получены с использованием исчисления сИксTбыть дифференцируемым и иметь ряд Тейлора. Броуновское движение не дифференцируемо, а вместо этого имеет преемственность Холдераα < 0,5 в виде
Однако, как и в теории возмущений, процессы, которые не являются достаточно регулярными, не расширяются в терминах ряда Тейлора, но с регулярностью Гольдера α они могут быть расширены с точки зрения серии Puiseux с точки зрения αт. е. для броуновского движения существует расширение понятия ряда Тейлора, которое расширяется в терминах 12производные. Как и в регулярном исчислении, первый член - это «линейный член», то есть изменениеdt в Δt а также dWt в N(0,dt)и вы понимаете что-то правильно Вот почему методы, включая такие вещи, как Эйлер-Маруяма, сходятся с сильным порядком 0,5: они получают первый член в ряду Тейлора правильно. Однако члены более высокого порядка должны иметь поправки на тот факт, чтоXt не является непрерывно дифференцируемой, поэтому обычные методы этого не делают.
Мгновенные корреляции и итерированные интегралы
Это быстрое эвристическое объяснение, но есть кое-что еще. Давайте посмотрим на несколько других деталей. Ряд Тейлора - это не просто разложение в терминах производных, но его также можно рассматривать как число членов высшего порядка для интегрирования.Xt=X0+Δtf(t,Xt)интегрируется один раз. Но если вы добавитеdt2 термин, чтобы получить единицы правильно, вам нужно сделать двойные интегралы. dt2 легко интегрировать дважды, но что dWitdWjt? Это мгновенные корреляции между броуновскими движениями. Вы должны знать это, чтобы вычислить двойной интеграл. Если вы смотрите только на средние значения, вы можете отменить это. Но в любой траектории есть корреляции между различными броуновскими движениями системы дифференциальных уравнений. Предполагая, что между броуновскими движениями нет корреляций, это еще один способ охарактеризовать расширение Маруямы детерминированных методов, но чтобы получить следующий член в ряду (член 1.0), вы должны получить это право. Поправка Мильштейна как раз и добавляет эти условия корреляции. Когда шум диагональный, это эквивалентно пониманию того, что нет никакой корреляции, кроме как с самим собой, но корреляция с самим собой - это просто дисперсия, котораяdtи поэтому должно быть исправление dW2t против dtт.е. dW2−dt, При наличии недиагонального шума эти двойные интегралы должны быть аппроксимированы так, чтобы учитывались мгновенные корреляции броуновских движений, и общим приближением здесь является приближение Викторссона, которое затем делает моделирование недиагонального шума настолько сложным (поскольку нет аналитического решения даже для двойных интегралов).
Средний эффект диффузии
Но это приводит нас к другому взгляду на проблему. Думая о расширении с точки зрения моментов, в некотором эвристическом смысле, член первого порядка, сильный порядок 1,0 илиO(Δt)термин, должны получить средние движения правильно, верно? Вот вопрос: что является производным отgво время? Самый простой ответ - определить производную обычным способом:
но это не совсем правильно при установке gв контексте SDE. Если мы думаем о производнойg с точки зрения того, насколько это меняется Xtв среднем он не всегда указывает в одном и том же направлении, поскольку он всегда умножается на этот случайный коэффициент dWt, Вопрос: каков средний размер этогоdWt? Диффузия имеет изменения в среднем по шкалеΔt−−−√так что на самом деле аффект, который g(t,Xt) имеет больше похоже
g(t+Δt,Xt+Δt)−g(t,Xt)Δt−−−√
Вы можете более строго показать, что числовая производная должна быть такой с Xt+Δt=Xt+g(t,Xt)Δt−−−√ как «предиктор вперед во времени».
Но интуитивно, это просто понимание среднего эффекта, который g имеет на траектории Xt: около g(t,Xt)Δt−−−√, В методе Рунге-Кутты, внутренний шаг во времениci должен быть приближенным значением Xt+ciΔtНо даже из этого быстрого физического эвристического рассуждения о диффузии мы видим, что простое расширение метода Рунге-Кутты в среднем уже неверно: оно примерно g(t,Xt)ciΔt−−−−√это еще один способ объяснить, почему он имеет максимальный порядок 0,5 (удивительно, что методы все еще работают! Но вы можете объяснить это тем, что сумма этапов в методе RK должна быть равна 1, и поэтому эта ошибка несколько отменяется вне). Интересно, что этот эвристический аргумент идет довольно глубоко, поскольку стохастические методы Рунге-Кутты более высокого порядка, такие как те, что связаны с Росслером, имеют исправления, которые точно связаны сg(t,Xt)Δt−−−√,
Вывод
Это 3 разных эвристических способа понять, почему более высокие порядки должны включать стохастическое исчисление. Более высокие порядки должны учитывать тот факт, что регулярность Гольдера равна 1/2, и, таким образом, в ряду Тейлора есть дополнительные члены, они должны учитывать мгновенные корреляции и, по крайней мере, учитывать средние эффекты диффузионного члена. , В противном случае они обречены не быть правильнымиO(Δt)и вместо этого только удовлетворяют «линейной аппроксимации» первого члена и получают O(Δt−−−√),
Конечно, в некоторых обстоятельствах есть способы найти подходящие обобщения, которые дают методы более высокого порядка, но я оставлю это как висящий поток, потому что это один из пунктов статьи, которую я скоро представлю. Надеюсь это поможет.