Как работает Kriging Interpolation?

Я работаю над проблемой, в которой мне нужно использовать Кригинг, чтобы предсказать значение некоторых переменных на основе некоторых окружающих переменных. Я хочу реализовать его код самостоятельно. Итак, я просмотрел слишком много документов, чтобы понять, как это работает, но я был так растерян. Как правило, я понимаю, что это средневзвешенное значение, но я не мог полностью понять процесс вычисления веса, а затем предсказать значение переменной.

Может ли кто-нибудь объяснить мне в простых терминах математические аспекты этого метода интерполяции и как он работает?

spatial interpolation kriging

— Dania
источник

Реализация кода - это отличный инструмент обучения, но его нельзя рекомендовать для работы над актуальными проблемами. К тому времени, как вы получите код, написанный, отлаженный и протестированный, вы обнаружите, что он требует на порядок больше усилий для предоставления дополнительных инструментов для анализа пространственных исследовательских данных, вариографии, перекрестной проверки вариограммы, поиска окрестностей и пост-анализа. обработка кригед-результатов. Разумным и эффективным компромиссом было бы начать с рабочего кода, такого как GSLib или GeoRGLM , и изменить его.

— whuber

Большое спасибо, это отличная идея, но я также хочу понять математический аспект Кригинга, есть ли у вас ресурс, который объясняет это ясно в простых терминах? Спасибо.

— Дания

Этот ответ состоит из вводного раздела, который я недавно написал для статьи, описывающей (скромное) пространственно-временное расширение «Универсального Кригинга» (Великобритания), которое само по себе является скромным обобщением «Обычного Кригинга». Он состоит из трех подразделов: теория дает статистическую модель и предположения; Оценка кратко рассматривает оценку параметра наименьших квадратов; и Прогнозирование показывает, как кригинг вписывается в структуру Обобщенных наименьших квадратов (GLS). Я приложил усилия, чтобы принять нотацию, знакомую статистикам, особенно посетителям этого сайта, и использовать концепции, которые хорошо объяснены здесь.

Подводя итог, можно сказать , что кригинг - это лучшее линейное непредвзятое прогнозирование (BLUP) случайного поля. Это означает, что прогнозируемое значение в любом месте выборки получается как линейная комбинация значений и ковариат, наблюдаемых в местах выборки. Там (неизвестное, случайное) значение имеет предполагаемую корреляцию со значениями выборки (и значения выборки соотносятся между собой). Эта корреляционная информация легко переводится в дисперсию прогноза. Каждый выбирает коэффициенты в линейной комбинации («веса Кригинга»), которые делают эту дисперсию настолько малой, насколько это возможно, при условии нулевого смещения в прогнозе. Подробности следуют.

теория

Великобритания включает в себя две процедуры - одну из оценки, а другую - прогнозирования, которые выполняются в контексте модели GLS для области исследования. В GLS модель предполагает , что выборка данных являются результатом случайных отклонений вокруг тренда , и что эти отклонения связаны между собой . Тренд подразумевается в общем смысле значения, которое может быть определено линейной комбинацией неизвестных коэффициентов (параметров) $z_i,\ (i = 1, 2, ..., n)$ $p$ . (В этом посте штрих обозначает транспонирование матрицы, а все векторы считаются векторами столбцов.) $\beta=(\beta_1,\beta_2,\ldots,\beta_p)^\prime$ $^\prime$

В любом месте в пределах области изучения имеется набор числовых атрибутов называемых «независимыми переменными» или «ковариатами». (Обычно является «постоянным членом», и могут быть пространственными координатами, а дополнительные $\mathbf y = (y_1, y_2, \ldots, y_p)^\prime$ $y_1 = 1$ $y_2$ $y_3$ $y_i$ может представлять пространственную информацию, а также другую вспомогательную информацию, которая доступна во всех местах в исследуемой области, например, пористость водоносного горизонта или расстояние до насосной скважины.) В каждом местоположении данных , в дополнение к его ковариатам , ассоциированное наблюдение считается реализацией случайной величины . В противоположность этому , $i$ $y_i = (y_{i1}, y_{i2}, \ldots, y_{ip})^\prime$ $z_i$ $Z_i$ $y_i$ считаются значениями, определяемыми или характеризующими точки или небольшие области, представленные наблюдениями (данные «поддерживают»). не считаются реализациями случайных величин и должны быть связаны со свойствами любого из . $y_i$ $Z_i$

Линейная комбинация выражает ожидаемое значение в терминах параметров , который представляет собой Значение тренда в месте . Процесс оценки использует данные , чтобы найти значения , которые представляют собой неизвестные параметры

Е [Z_{я}] знак равно {Y^{'}}_{я} β знак равно Y_{я 1} β_{1} + Y_{я 2} β_{2} + \dots + Y_{я п} β_{п}

${\bf{E}}\left[ {Z_i } \right] = {\bf{y'}}_i {\bf{\beta }} = y_{i1} \beta _1 + y_{i2} \beta _2 + \cdots + y_{ip} \beta _p$

Z_{i}

$Z_i$

β

$\beta$

i

$i$

{\hat{β}}_{i}

$\hat\beta_i$

β_{i}

$\beta_i$ тогда как процесс прогнозирования использует данные в местоположениях

чтобы вычислить значение в местоположении без выборки, которое здесь индексируется как

. Цели оценки являются фиксированными ( то есть неслучайными) параметрами, тогда как цель прогнозирования является случайной, поскольку значение

включает в себя случайные колебания вокруг его тренда

. Как правило, прогнозы делаются для нескольких местоположений, используя одни и те же данные, меняя местоположение

i = 1, 2, \dots, n

$i = 1, 2, \ldots, n$

i = 0

$i = 0$

z_{0}

$z_0$

y_{0}^{'} β

$y_0^\prime\beta$

0

$0$ , Например, часто делаются прогнозы для отображения поверхности вдоль регулярной сетки точек, подходящих для контурирования.

Предварительный расчет

Классический кригинг предполагает, что случайные флуктуации имеют ожидаемые значения нуля, и их ковариации известны. Запишите ковариацию между и как . Используя эту ковариацию, оценка выполняется с использованием GLS. Ее решение заключается в , где $Z_i$ $Z_i$ $Z_j$ $c_{ij}$

\hat{β} знак равно ЧАС Z, ЧАС знак равно {({Y^{'} С}^{- 1} Y)}^{- 1} {Y^{'} С}^{- 1}

$\hat\beta=\bf{Hz},\ {\bf{H}} = \left( {{\bf{Y'C}}^{{\bf{ - 1}}} {\bf{Y}}} \right)^{{\bf{ - 1}}} {\bf{Y'C}}^{{\bf{ - 1}}}$

-вектор наблюдений,

(«матрица проектирования») - этоматрица

, строки которой представляют собой векторы

, а

-ковариационная матрица

by-

которая предполагается обратимой (Draper & Smith (1981), раздел 2.11).

z = (z_{1}, z_{2}, \dots, z_{n})

${\bf {z}} = (z_1, z_2, \ldots, z_n)$

n

$n$

Y = (y_{i j})

${\bf Y} = (y_{ij})$

n

$n$

p

$p$

y_{i}^{'}, 1 \leq i \leq n

$y_i^\prime, 1 \le i \le n$

C = (c_{i j})

$\mathbf C = (c_{ij})$

n

$n$

n

$n$

от

матрицы

, которая проецирует данные

на параметр оценки

, называется «матрица шлема»Формулировка

как применение матрицы шлема к даннымявном виде показываеткак оценки параметров линейно зависят от данных. Ковариации

классически вычисляются с использованием вариограммы, которая дает ковариацию с точки зрения местоположения данных, хотя не имеет значения, как на самом деле рассчитывается ковариация.

p

$p$

n

$n$

H

$\mathbf H$

z

$\mathbf z$

\hat{β}

$\hat \beta$

\hat{β}

$\hat\beta$

C = (c_{i j})

$\mathbf C = (c_{ij})$

прогнозирование

Великобритания аналогично предсказывает с помощью линейной комбинации данных называю «Кригинг веса» для предсказания . Великобритания выполняет это предсказание , удовлетворяя двум критериям. Во-первых, прогноз должен быть непредвзятым, что выражается в требовании линейной комбинации случайных величин. $z_0$

{\hat{Z}}_{0} знак равно λ_{1} Z_{1} + λ_{2} Z_{2} + \dots + λ_{N} Z_{N} знак равно λ^{'} Z,

$\hat z_0 = \lambda _1 z_1 + \lambda _2 z_2 + \cdots + \lambda _n z_n = {\bf{\lambda 'z}}.$

λ_{i}

$\lambda_i$

z_{0}

$z_0$

z_{0}

$z_0$

равен

в среднем:

Это ожидание принято для совместного

-вариантного распределения

Z_{i}

$Z_i$

Z_{0}

$Z_0$

0 знак равно Е [{\hat{Z}}_{0} - Z_{0}] знак равно Е [λ^{'} Z - Z_{0}],

$0 = {\bf{E}}\left[ {\hat Z_0 - Z_0 } \right] = {\bf{E}}\left[ {{\bf{\lambda 'Z}} - Z_0 } \right].$

n + 1

$n+1$

Z_{0}

$Z_0$

Z = (Z_{1}, Z_{2}, \dots, Z_{n})

$\mathbf Z = (Z_1, Z_2, \ldots, Z_n)$ , Линейность ожидания вместе с предположением тренда (1) подразумевает:

\begin{aligned} 0 & знак равно Е [λ^{'} Z - Z_{0}] знак равно λ^{'} Е [Z] - Е [Z_{0}] знак равно λ^{'} (Y β) - {Y^{'}}_{0} β знак равно (λ^{'} Y - {Y^{'}}_{0}) β \\ знак равно β^{'} (Y^{'} λ - Y_{0}) \end{aligned}

$\eqalign{ 0 &= {\bf{E}}\left[ {{\bf{\lambda 'Z}} - Z_0 } \right] = {\bf{\lambda 'E}}\left[ {\bf{Z}} \right] - {\bf{E}}\left[ {Z_0 } \right] = {\bf{\lambda '}}\left( {{\bf{Y\beta }}} \right) - {\bf{y'}}_0 {\bf{\beta }} = \left( {{\bf{\lambda 'Y}} - {\bf{y'}}_0 } \right){\bf{\beta }}\\ &= {\bf{\beta '}}\left( {{\bf{Y'\lambda }} - {\bf{y}}_0 } \right) }$

$\beta$

{\hat{Y}}^{'} λ знак равно Y_{0},

$\hat{\mathbf Y}^\prime \lambda = \mathbf{y}_0.$

$\lambda$ $\hat Z_0 - Z_0$

В a р ({\hat{Z}}_{0} - Z_{0}) знак равно Е [{({\hat{Z}}_{0} - Z_{0})}^{2}] знак равно Е [{(λ^{'} Z - Z_{0})}^{2}] знак равно с_{00} - 2 {λ^{'} с}_{0} + λ^{'} С λ

${\rm{Var}}\left( {\hat Z_0 - Z_0 } \right) = {\bf{E}}\left[ {\left( {\hat Z_0 - Z_0 } \right)^2 } \right] = {\bf{E}}\left[ {\left( {{\bf{\lambda 'Z}} - Z_0 } \right)^2 } \right] = c_{00} - 2{\bf{\lambda 'c}}_0 + {\bf{\lambda 'C\lambda }}$

c_{0} = (c_{01}, c_{02}, \dots, c_{0 n})^{'}

$\mathbf c_0 = (c_{01}, c_{02}, \ldots, c_{0n})^\prime$

Z_{0}

$Z_0$

Z_{i}, i \geq 1

$Z_i,\ i \ge 1$

c_{00}

$c_{00}$

Z_{0}

$Z_0$

$\lambda$ $p$ $\mu$ $\hat{\mathbf Y}^\prime \lambda = \mathbf{y}_0$ $n+p$

(\begin{matrix} С & Y \\ Y^{'} & 0 \end{matrix}) (\begin{matrix} λ \\ μ \end{matrix}) знак равно (\begin{matrix} с_{0} \\ Y_{0} \end{matrix})

$\left( {\begin{array}{*{20}c} {\bf{C}} & {\bf{Y}} \\ {{\bf{Y'}}} & {\bf{0}} \\ \end{array}} \right)\left( {\begin{array}{*{20}c} {\bf{\lambda }} \\ {\bf{\mu }} \\ \end{array}} \right) = \left( {\begin{array}{*{20}c} {{\bf{c}}_{\bf{0}} } \\ {{\bf{y}}_{\bf{0}} } \\ \end{array}} \right)$

0

$\mathbf 0$

p

$p$

p

$p$

1

$\mathbf 1$

n

$n$

n

$n$

λ

$\lambda$

λ знак равно {{ЧАС}^{'} Y}_{0} + С^{- 1} (1 - Y ЧАС) с_{0},

${\bf{\lambda }} = {\bf{H'y}}_0 + {\bf{C}}^{ - 1} \left( {{\bf{1}} - {\bf{YH}}} \right){\bf{c}}_0.$

(Читатели, знакомые с множественной регрессией, могут посчитать полезным сравнить это решение с ковариационным решением обыкновенных уравнений наименьших квадратов , который выглядит практически точно так же, но без множителей Лагранжа.)

$\lambda$ $[\mathbf H^\prime\, \mathbf y_0]$ $Z_0$ $\hat z_0$

— Whuber
источник

Большое вам спасибо, это именно то, что я ищу. Вы решили эту проблему для меня, теперь я понимаю Кригинг. Я очень ценю вашу помощь, большое спасибо.

— Дания

{\hat{Y}}^{'}

$\hat{\mathbf Y}^\prime$

Y^{'} = (y_{j i})

${\bf Y}^\prime = (y_{ji})$

p

$p$

n

$n$

y_{i}, 1 \leq i \leq n

$y_i, 1 \le i \le n$