Моделирование пространственного тренда путем регрессии с координатами качестве предикторов

Я планирую включить координаты в качестве ковариат в уравнение регрессии, чтобы скорректировать пространственный тренд, который существует в данных. После этого я хочу протестировать остатки на пространственной автокорреляции в случайной вариации. У меня есть несколько вопросов:

Должен ли я выполнять линейную регрессию, в которой только независимые переменные являются координатами и а затем проверять невязки на пространственной автокорреляции, или лучше включить не только координаты в качестве ковариат, но и другие переменные, а затем проверять невязки. $x$ $y$
Если я ожидаю иметь квадратичный тренд, а затем включить не только , но также , и , но тогда некоторые из них ( и ) будут иметь значение выше, чем Порог - следует ли исключить те переменные с более высоким значением как незначимые? Как мне тогда интерпретировать тенденцию, она больше не является квадратичной? $x,y$ $xy$ $x^2$ $y^2$ $xy$ $y^2$ $p$ $p$
Я полагаю, что я должен рассматривать координаты и как любые другие ковариаты и проверять их наличие линейных отношений с зависимой переменной путем построения частичных остаточных графиков ... но затем, как только я преобразую их (если они покажут, что им нужно преобразование), это не будет будь такого рода тренд больше (особенно если я включаю , и для квадратичного тренда). Это может показать, что , например, нуждается в преобразовании, а нет или нет? Как мне реагировать в этих ситуациях? $x$ $y$ $xy$ $x^2$ $y^2$ $x^2$ $x$

Спасибо.

— Бека
источник

Я думаю, что вам может быть лучше подобрать линейную модель смешанных эффектов с пространственно коррелированными случайными эффектами (иногда называемыми геостатистической моделью). Предполагая, что ваши данные гауссовы, вы указываете модель в виде:

$Y_i = \mu_i + S_i + \epsilon_i,$

для наблюдений , где представляет ошибки iid и представляя ваши пространственные термины (где ). Среднее значение может быть функцией других ковариат (т. и т. Д.) Или может быть просто константой (лучше всего начинать с последнее для простоты). $n$ $1 \leq i \leq n$ $\epsilon \sim N(0,\tau^2)$ $\mathbb{S} \sim MVN(\mathbb{0},\sigma^2 R)$ $\mathbb{S} = \{S_1,...,S_n\}$ $\mu_i$ $\mu_i = \beta_0 + \beta_1 x_{i1} + \beta_2 x_{i2}$

Матрица корреляции для пространственных слагаемых (которая определяет, насколько коррелируемой, по вашему мнению, должно быть каждое наблюдение), может быть определена с помощью эмпирической вариограммы. Обычно корреляция между наблюдениями выбирается так, чтобы зависеть только от расстояния между ними (именно здесь ваши координаты входят в модель). $R$

Глава 2 Геостатистики на основе моделей Диггла и Рибейру (2000) должна дать вам более подробное введение. В пакете R geoR есть много процедур для подгонки геостатистических моделей, поэтому вы можете найти его полезным (см. Http://cran.r-project.org/web/packages/geoR/geoR.pdf ).

— Сэм Ливингстон
источник