Основные преимущества моделей гауссовских процессов


11

Гауссовский процесс широко используется, особенно в эмуляции. Известно, что вычислительная потребность высока ( ).0(n3)

  1. Что делает их популярными?
  2. Каковы их основные и скрытые преимущества?
  3. Почему они используются вместо параметрических моделей (под параметрической моделью я подразумеваю типичную линейную регрессию, в которой различные параметрические формы могут использоваться для описания входного и выходного тренда (например, qaudratic)?

Я был бы очень признателен за технический ответ, объясняющий присущие ему свойства, которые делают гауссовский процесс уникальным и выгодным


Можете ли вы уточнить, что вы подразумеваете под параметрическими моделями?
Алексей Зайцев

@ Алексей, я пояснил, что я имею в виду под параметрической моделью выше. Спасибо
Мудрого

Из того, что я предполагаю о параметрических моделях, вам нужно указать модель вручную для каждой задачи. Это не всегда возможно, так как истинная природа не всегда известна. Более того, могут возникнуть трудности с подгонкой этих моделей, в то время как для гауссовских процессов оценка параметров работает хорошо почти каждый раз.
Алексей Зайцев

4
Сплайны и линейная регрессия эквивалентны регрессии гауссовских процессов с выбранной функцией ковариации. Но гауссовские процессы обеспечивают удобную вероятностную структуру, хорошо подходящую для многих задач.
Алексей Зайцев

1
Когда бы вы не использовали Gaussian Process?
Алби

Ответы:


6

Основные преимущества с инженерной точки зрения (как упомянул @Alexey). В широко используемой процедуре Кригинга вы можете интерпретировать свое собственное «пространство», предоставляя «корреляционную» (или ковариационную) модель (обычно называемую эллипсоидом вариограммы ) для отношений, зависящих от расстояния и ориентации.

Нет ничего, что мешало бы другим методологиям иметь такие же особенности, просто случилось так, что способ, которым кригинг был впервые концептуализирован, имел дружественный подход к людям, которые не были статистиками.

В настоящее время с появлением стохастических методологий, основанных на геостатистике, таких как, например, Последовательное моделирование Гаусса , эти процедуры используются в секторах, где важно определить пространство неопределенности (которое может принимать от нескольких тысяч до миллионов измерений). Опять же, с инженерной точки зрения, алгоритмы, основанные на геостатистике, очень легко включить в генетическое программирование . Также, когда у вас есть обратные проблемы, вам нужно протестировать несколько сценариев и проверить их адаптивность к вашей функции оптимизации.

Давайте на мгновение оставим чистую аргументацию за фактами для современного реального примера такого использования. Вы можете либо напрямую пробовать подземные пробы (точные данные), либо создать сейсмическую карту недр (мягкие данные).

В достоверных данных вы можете измерить свойство (скажем, акустический импеданс) напрямую без ошибки (ish). Проблема в том, что это мало (и дорого). С другой стороны, у вас есть сейсмическое картирование, которое буквально представляет собой объемную пиксельную карту недр, но не дает вам акустического сопротивления. Для простоты, скажем, это дает вам соотношение между двумя значениями акустического сопротивления (сверху и снизу). Таким образом, отношение 0,5 может быть делением 1000/2000 или 10 000/20 000. Это пространство с несколькими решениями, и подойдет несколько комбинаций, но только одна точно представляет реальность. Как вы решаете это?

То , как сейсмические инверсии работа (стохастические процедуры) является производя правдоподобно (и это другая история все вместе) сценарий акустического импеданса (или других свойств), преобразование этих сценариев в синтетическом сейсмический (например , соотношении в предыдущем примере) и сравнить синтетическую сейсмику с реальной (корреляция). Лучшие сценарии будут использованы для создания еще большего количества сценариев, сходящихся в решение (это не так просто, как кажется).

Принимая это во внимание и говоря с точки зрения удобства использования, я бы ответил на ваши вопросы следующим образом:

1) То, что делает их популярными, - это простота использования, гибкость в реализации, большое количество исследовательских центров и учреждений, которые продолжают разрабатывать новые и более адаптируемые процедуры на основе гаусса для нескольких различных областей (в частности, в области наук о Земле, включая ГИС).

2) Основными преимуществами , как уже упоминалось ранее, являются удобство использования и гибкость с моей точки зрения. Если им легко манипулировать и им легко пользоваться, просто сделай это. В гауссовских процессах нет особых особенностей, которые нельзя воспроизвести в других методологиях (статистических или иных).

3) Они используются, когда вам нужно включить в модель больше информации, чем просто данные (такая информация имеет пространственные отношения, статистические распределения и т. Д.). Я могу заверить, что если у вас много данных с изотропным поведением, использование кригинга - пустая трата времени. Вы можете получить те же результаты, используя любой другой метод, который требует меньше информации и быстрее запускается.


А когда другая модель лучше?
Бен

1
@Ben Это всегда будет зависеть от тематического исследования. Кригинг или методы, основанные на кригинге, требуют больших вычислительных затрат (поэтому не быстрых). Например, современные телевизоры 4k (или более) используют методы интерполяции, чтобы попытаться улучшить контент, созданный для меньших разрешений. Это подразумевает, что он должен выполнить эту операцию быстро и без вмешательства пользователя (что потребует ковариационная модель). Если бы я решил эту конкретную проблему, я бы вообще избегал Кригинга. Более того, некоторые явления основаны на
шаблонах

А когда скорость не важна?
Бен

Скорость @Ben менее важна, если ваш результат не должен быть немедленным. Подповерхностное моделирование, прогнозирование погоды и множество операций в области наук о ГИС - это лишь несколько примеров. Другой - тот, который представлен в ответе (сейсмическая инверсия).
armatita

Извините, не понял этого. Ни вычислительная, ни скорость результата не имеют значения, каковы недостатки GP? Или другими словами: разве это не должно использоваться намного чаще?
Бен

7

Для инженеров важно:

  • иметь доверительные интервалы для прогнозов
  • интерполировать данные обучения
  • иметь гладкие и нелинейные модели
  • использовать полученные регрессионные модели для адаптивного проектирования экспериментов и оптимизации

Гауссовские процессы отвечают всем этим требованиям.

Более того, часто наборы инженерных и геостатистических данных не такие большие или имеют специфическую сеточную структуру, позволяющую быстро делать выводы.


1
Спасибо за ваш комментарий . Кажется, из-за их байесовской интерпретации модели гауссовского процесса могут иметь хорошую количественную оценку неопределенности, однако это также возможно в параметрической регрессии. Я ищу технический подход, который может объяснить набор статистических преимуществ
Wis

3

Преимущества гауссовой модели.

Гауссовский PDF зависит только от моментов 1-го и 2-го порядка. Стационарный гауссовский процесс в широком смысле также является стационарным процессом в строгом смысле и наоборот.

Гауссовы PDF-файлы могут моделировать распределение многих процессов, включая некоторые важные классы сигналов и шумов. Сумма многих независимых случайных процессов имеет гауссово распределение (центральная предельная теорема).

Негауссовы процессы могут быть аппроксимированы взвешенной комбинацией (т. Е. Смесью) ряда гауссовых pdf с соответствующими средними и дисперсиями.

Оптимальные методы оценки, основанные на гауссовых моделях, часто приводят к линейным и математически трактуемым решениям.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.