Этот ответ состоит из вводного раздела, который я недавно написал для статьи, описывающей (скромное) пространственно-временное расширение «Универсального Кригинга» (Великобритания), которое само по себе является скромным обобщением «Обычного Кригинга». Он состоит из трех подразделов: теория дает статистическую модель и предположения; Оценка кратко рассматривает оценку параметра наименьших квадратов; и Прогнозирование показывает, как кригинг вписывается в структуру Обобщенных наименьших квадратов (GLS). Я приложил усилия, чтобы принять нотацию, знакомую статистикам, особенно посетителям этого сайта, и использовать концепции, которые хорошо объяснены здесь.
Подводя итог, можно сказать , что кригинг - это лучшее линейное непредвзятое прогнозирование (BLUP) случайного поля. Это означает, что прогнозируемое значение в любом месте выборки получается как линейная комбинация значений и ковариат, наблюдаемых в местах выборки. Там (неизвестное, случайное) значение имеет предполагаемую корреляцию со значениями выборки (и значения выборки соотносятся между собой). Эта корреляционная информация легко переводится в дисперсию прогноза. Каждый выбирает коэффициенты в линейной комбинации («веса Кригинга»), которые делают эту дисперсию настолько малой, насколько это возможно, при условии нулевого смещения в прогнозе. Подробности следуют.
теория
Великобритания включает в себя две процедуры - одну из оценки, а другую - прогнозирования, которые выполняются в контексте модели GLS для области исследования. В GLS модель предполагает , что выборка данных являются результатом случайных отклонений вокруг тренда , и что эти отклонения связаны между собой . Тренд подразумевается в общем смысле значения, которое может быть определено линейной комбинацией p неизвестных коэффициентов (параметров) β = ( β 1 , β 2 , … , βzi, (i=1,2,...,n)p . (В этом посте штрих ' обозначает транспонирование матрицы, а все векторы считаются векторами столбцов.)β=(β1,β2,…,βp)′′
В любом месте в пределах области изучения имеется набор числовых атрибутов называемых «независимыми переменными» или «ковариатами». (Обычно y 1 = 1 является «постоянным членом», y 2 и y 3 могут быть пространственными координатами, а дополнительные y iy=(y1,y2,…,yp)′y1=1y2y3Yяможет представлять пространственную информацию, а также другую вспомогательную информацию, которая доступна во всех местах в исследуемой области, например, пористость водоносного горизонта или расстояние до насосной скважины.) В каждом местоположении данных , в дополнение к его ковариатам y i = ( y i 1 , y i 2 , … , y i p ) ′ , ассоциированное наблюдение z i считается реализацией случайной величины Z i . В противоположность этому , у яяYя= ( уя 1, уя 2, ... , уя п)'ZяZяYясчитаются значениями, определяемыми или характеризующими точки или небольшие области, представленные наблюдениями (данные «поддерживают»). не считаются реализациями случайных величин и должны быть связаны со свойствами любого из Z I .YяZя
Линейная комбинация
выражает ожидаемое значение Z i в терминах параметров β , который представляет собой Значение тренда в месте я . Процесс оценки использует данные , чтобы найти значения р I , которые представляют собой неизвестные параметры р I
E [ Zя] = у'яβ= уя 1β1+ уя 2β2+ ⋯ + уя пβп
Zяβяβ^яβятогда как процесс прогнозирования использует данные в местоположениях
чтобы вычислить значение в местоположении без выборки, которое здесь индексируется как
i = 0 . Цели оценки являются фиксированными (
то есть неслучайными) параметрами, тогда как цель прогнозирования является случайной, поскольку значение
z 0 включает в себя случайные колебания вокруг его тренда
y ′ 0 β . Как правило, прогнозы делаются для нескольких местоположений, используя одни и те же данные, меняя местоположение
0я = 1 , 2 , … , ня = 0Z0Y'0β0, Например, часто делаются прогнозы для отображения поверхности вдоль регулярной сетки точек, подходящих для контурирования.
Предварительный расчет
Классический кригинг предполагает, что случайные флуктуации имеют ожидаемые значения нуля, и их ковариации известны. Запишите ковариацию между Z i и Z j как c i j . Используя эту ковариацию, оценка выполняется с использованием GLS. Ее решение заключается в
следующем: β = Н г , Н = ( Y ' С - 1 У ) - 1 Y ' С - 1 ,
где г = ( г 1ZяZяZJся ж
β^= H z , H = ( Y 'С- 1Y )- 1Y'С- 1
-
n -вектор наблюдений,
Y = ( y i j ) («матрица проектирования») - этоматрица
n by
p , строки которой представляют собой векторы
y ′ i , 1 ≤ i ≤ n , а
C = ( c i j ) -ковариационная матрица
n- by-
n, которая предполагается обратимой (Draper & Smith (1981), раздел 2.11).
z =( z1, z2, … , ZN)NY =( уя ж)NпY'я, 1 ≤ i ≤ nC =( Cя ж)NN от
п матрицы
H , которая проецирует данные
г на параметр оценки
р , называется «матрица шлема»Формулировка
р как применение матрицы шлема к даннымявном виде показываеткак оценки параметров линейно зависят от данных. Ковариации
C = ( c i j ) классически вычисляются с использованием вариограммы, которая дает ковариацию с точки зрения местоположения данных, хотя не имеет значения, как на самом деле рассчитывается ковариация.
пNЧАСZβ^β^C =( Cя ж)
прогнозирование
Великобритания аналогично предсказывает с помощью линейной комбинации данных
г 0 = λ 1 г 1 + λ 2 г 2 + ⋯ + λ п г п = λ ' г . Λ я называю «Кригинг веса» для предсказания г 0 . Великобритания выполняет это предсказание z 0 , удовлетворяя двум критериям. Во-первых, прогноз должен быть непредвзятым, что выражается в требовании линейной комбинации случайных величин.Z0
Z^0= λ1Z1+ λ2Z2+ ⋯ + λNZN= λ'г .
λяZ0Z0 равен
Z 0 в среднем:
0 = E [ Z 0 - Z 0 ] = E [ λ ' Z - Z 0 ] .
Это ожидание принято для совместного
n + 1 -вариантного распределения
Z 0 и
Z = ( Z 1 , Z 2 , … , Z n )ZяZ00 = E [ Z^0- Z0] = E [ λ'Z - Z0] .
n + 1Z0Z =( Z1, Z2, … , ZN), Линейность ожидания вместе с предположением тренда (1) подразумевает:
0= E [ λ'Z - Z0] = λ'E [ Z ]- E [ Z0] = λ'( Y β) - у'0β= ( λ'Г - у'0) β= β'( Y'λ - y0)
β
Y^'λ = y0,
λZ^0- Z0
V a r ( Z^0- Z0) = E [ ( Z^0- Z0)2] = E [ ( λ'Z - Z0)2] = с00- 2 λ'с0+ λ'C λ
с0= ( с01, с02, … , С0 н)'Z0Zя, я ≥ 1 с00Z0
λпμY^'λ = y0н + р
( CY'Y0) ( λμ) = ( с0Y0)
0пп1NNλλ = H'Y0+ C- 1( 1 - Y H ) c0,
(Читатели, знакомые с множественной регрессией, могут посчитать полезным сравнить это решение с ковариационным решением обыкновенных уравнений наименьших квадратов , который выглядит практически точно так же, но без множителей Лагранжа.)
λ[ H'Y0]Z0Z^0