Модель линейной регрессии, которая лучше всего подходит для данных с ошибками

Я ищу алгоритм линейной регрессии, который наиболее подходит для данных, чья независимая переменная (x) имеет постоянную ошибку измерения, а зависимая переменная (y) имеет ошибку, зависящую от сигнала.

введите описание изображения здесь

Изображение выше иллюстрирует мой вопрос.

— user46178
источник

Если постоянная переменная x имеет постоянную ошибку измерения, и ошибки используются только для относительного взвешивания переменных, разве эта ситуация не эквивалентна отсутствию ошибок в x?

— педрофигейра

@pedro Это не так, потому что ошибки в

- это не просто веса в формуле. При регрессии ошибок в переменных совпадения будут отличаться, а ковариационные оценки параметров будут отличаться от обычной регрессии.

x

$x$

— whuber

Спасибо за разъяснение. Не могли бы вы немного рассказать, почему это так?

— педрофигейра

Погрешность измерения в зависимой переменной

Для общей линейной модели с гомоскедастичным, не автокоррелированным и некоррелированным с независимыми переменными, пусть обозначает «истинную» переменную, а ее наблюдаемую измерения. Погрешность измерения определяется как их разность Таким образом, оцениваемая модель имеет вид:

\begin{matrix} (1) & Y знак равно β_{0} + β_{1} {Икс}_{1} + \dots + β_{К} {Икс}_{К} + ε \end{matrix}

$y=\beta_0+\beta_1 x_1+\cdots+\beta_kx_k+\varepsilon\tag{1}$

ε

$\varepsilon$

y^{*}

$y^*$

y

$y$

е знак равно Y - Y^{*}

$e=y-y^*$

\begin{matrix} (2) & Y знак равно β_{0} + β_{1} {Икс}_{1} + \dots + β_{К} {Икс}_{К} + е + ε \end{matrix}

$y=\beta_0+\beta_1 x_1+\cdots+\beta_kx_k+e+\varepsilon\tag{2}$ Поскольку

наблюдаются, мы можем оценить модель по OLS. Если ошибка измерения в

статистически не зависит от каждой объясняющей переменной, то

имеет те же свойства, что и

и обычные процедуры вывода OLS ( статистика

Д.) Являются действительными. Тем не менее, в вашем случае я бы ожидал увеличения дисперсии

. Вы можете использовать:

y, x_{1}, \dots, x_{k}

$y,x_1,\dots,x_k$

y

$y$

(e + ε)

$(e+\varepsilon)$

ε

$\varepsilon$

t

$t$

e

$e$

оценщик взвешенных наименьших квадратов (например, Kutner et al. , §11.1; Verbeek , §4.3.1-3);
оценщик OLS, который по-прежнему является беспристрастным и непротиворечивым, и стандартные ошибки, совместимые с гетероскедастичностью, или просто стандартные ошибки Wite ( Verbeek , §4.3.4).

Погрешность измерения в независимой переменной

$x_k^*$ $x_k$

е_{К} знак равно {Икс}_{К} - {Икс}_{К}^{*}

$e_k=x_k-x_k^*$

$\text{Cov}(x_k,e_k)=0$ $x^*_k$ $x_k^*=x_k-e_k$
$Y знак равно β_{0} + β_{1} {Икс}_{1} + \dots + β_{К} {Икс}_{К} + (ε - β_{К} е_{К})$ $y=\beta_0+\beta_1x_1+\cdots+\beta_kx_k+(\varepsilon-\beta_ke_k)$ $\varepsilon$ $e$ $x_j$ $x_k$
$\text{Cov}(x^*_k,\eta_k)=0$ $x_k$ $y$ $x_1,\dots,x_k$

Насколько я могу догадаться, глядя на ваш график (ошибки сосредоточены на «истинных» значениях независимой переменной), первый сценарий может быть применен.

— Sergio
источник