«Пространственная автокорреляция» означает разные вещи для разных людей. Общая концепция, однако, заключается в том, что явление, наблюдаемое в местоположениях может определенным образом зависеть от (a) ковариат, (b) местоположения и (c) его значений в близлежащих местоположениях. (В тех случаях, когда технические определения различаются, речь идет о виде рассматриваемых данных, о том, какой «определенный путь» постулируется и что означает «близлежащий»: все это необходимо сделать количественным, чтобы продолжить.)z
Чтобы увидеть, что может происходить, давайте рассмотрим простой пример такой пространственной модели для описания топографии региона. Пусть измеренная высота в точке будет . Одна из возможных моделей заключается в том, что определенным математическим образом зависит от координат , которые я напишу в этой двумерной ситуации. Позволяя представлять (гипотетически независимые) отклонения между наблюдениями и моделью (которые, как обычно предполагаются, имеют нулевое ожидание), мы можем написатьzy(z)yz(z1,z2)ε
y(z)=β0+β1z1+β2z2+ε(z)
для линейной модели тренда . Линейный тренд (представленный коэффициентами и ) является одним из способов уловить идею о том, что близкие значения и для close to , должен стремиться быть ближе друг к другу. Мы даже можем рассчитать это, учитывая ожидаемое значение размера разницы между и , . Оказывается, математика многоβ1β2y(z)y(z′)zz′y(z)y(z′)E[|y(z)−y(z′)|]проще, если мы используем немного другую меру разницы: вместо этого мы вычисляем ожидаемую квадратическую разницу:
E[(y(z)−y(z′))2]=E[(β0+β1z1+β2z2+ε(z)−(β0+β1z′1+β2z′2+ε(z′)))2]=E[(β1(z1−z′1)+β2(z2−z2)′+ε(z)−ε(z′))2]=E[(β1(z1−z′1)+β2(z2−z2)′)2+2(β1(z1−z′1)+β2(z2−z2)′)(ε(z)−ε(z′))+(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]
Эта модель не содержит явной пространственной автокорреляции, поскольку в ней нет термина, напрямую связывающего с близлежащими значениями .y(z)y(z′)
Альтернативная, отличная модель игнорирует линейный тренд и предполагает только наличие автокорреляции. Одним из способов сделать это является структура отклонений . Мы можем утверждать, чтоε(z)
y(z)=β0+ε(z)
и, чтобы учесть наше ожидание корреляции, мы примем некоторую «ковариационную структуру» для . Чтобы это было пространственно значимым, мы примем ковариацию между и , равную поскольку имеет нулевое среднее значение, имеет тенденцию уменьшаться по мере того, как и становятся все более и более удаленными. Поскольку детали не имеют значения, давайте просто назовем эту ковариацию . Это пространственная автокорреляция.εε(z)ε(z′)E[ε(z)ε(z′)]εzz′C(z,z′) Действительно, (обычно Pearson) корреляция между и являетсяy(z)y(z′)
ρ(y(z),y(z′))=C(z,z′)C(z,z)C(z′,z′)−−−−−−−−−−−−√.
В этих обозначениях предыдущая ожидаемая квадратичная разница для первой моделиy
E[(y(z)−y(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+C1(z,z)+C1(z′,z′)
(при условии ), поскольку предполагается, что в разных местах независимы. Я написал вместо чтобы указать, что это ковариационная функция для первой модели.z≠z′εC1C
Когда ковариации не сильно изменяются от одного местоположения к другому (действительно, они обычно предполагаются постоянными), это уравнение показывает, что ожидаемая квадратная разница в увеличивается квадратично с разделением между и . Фактическая сумма увеличения определяется коэффициентами тренда и .εyzz′β0β1
Давайте посмотрим, каковы ожидаемые квадратные различия в для новой модели, модели 2:y
E[(y(z)−y(z′))2]=E[(β0+ε(z)−(β0+ε(z′)))2]=E[(ε(z)−ε(z′))2]=E[ε(z)2−2ε(z)ε(z′)+ε(z′)2]=C2(z,z)−2C2(z,z′)+C2(z′,z′).
Опять же, это ведет себя правильно: поскольку мы полагали, что должен уменьшаться по мере того, как и становятся более разделенными, ожидаемая квадратная разница в «s действительно идет вверх с ростом разделения мест.C2(z,z′)zz′y
Сравнение двух выражений для в двух моделях показывает, что в первой модели играет роль, математически идентичную роли во второй модели. (Там скрывается аддитивная константа, скрытая в разных значениях , но это не имеет значения в этом анализе.) Следовательно , в зависимости от модели, пространственная корреляция обычно представляется как некоторая комбинация тренда и обусловленной структуры корреляции случайных ошибок.( β 1 ( z 1 - z ′ 1 ) + β 2 ( z 2 - z 2 ) ′ ) 2 - 2 C 2 ( z , z ′ ) C i ( z , z )E[(y(z)−y(z′))2](β1(z1−z′1)+β2(z2−z2)′)2−2C2(z,z′)Ci(z,z)
Теперь у нас есть, я надеюсь, четкий ответ на вопрос: можно представить идею, лежащую в основе Закона географии Тоблера («все связано со всем остальным, но более близкие вещи связаны») по-разному. В некоторых моделях закон Тоблера адекватно представлен включением трендов (или «дрейфующих» терминов), которые являются функциями пространственных координат, таких как долгота и широта. В других закон Тоблера захватывается с помощью нетривиальной ковариационной структуры среди аддитивных случайных членов (ε). На практике модели включают оба метода. Какой из них вы выберете, зависит от того, чего вы хотите достичь с помощью модели, и от вашего взгляда на то, как возникает пространственная автокорреляция - подразумевается ли она базовыми тенденциями или отражает изменения, которые вы хотите считать случайными. Ни один из них не всегда прав, и в любой конкретной проблеме часто возможно использовать оба вида моделей для анализа данных, понимания явления и прогнозирования его значений в других местах (интерполяция).