Модель линейной регрессии, которая лучше всего подходит для данных с ошибками


9

Я ищу алгоритм линейной регрессии, который наиболее подходит для данных, чья независимая переменная (x) имеет постоянную ошибку измерения, а зависимая переменная (y) имеет ошибку, зависящую от сигнала.

введите описание изображения здесь

Изображение выше иллюстрирует мой вопрос.


1
Если постоянная переменная x имеет постоянную ошибку измерения, и ошибки используются только для относительного взвешивания переменных, разве эта ситуация не эквивалентна отсутствию ошибок в x?
педрофигейра

2
@pedro Это не так, потому что ошибки в - это не просто веса в формуле. При регрессии ошибок в переменных совпадения будут отличаться, а ковариационные оценки параметров будут отличаться от обычной регрессии. Икс
whuber

1
Спасибо за разъяснение. Не могли бы вы немного рассказать, почему это так?
педрофигейра

Ответы:


2

Погрешность измерения в зависимой переменной

Для общей линейной модели с ε гомоскедастичным, не автокоррелированным и некоррелированным с независимыми переменными, пусть y обозначает «истинную» переменную, а y ее наблюдаемую измерения. Погрешность измерения определяется как их разность e = y - y ∗. Таким образом, оцениваемая модель имеет вид: y = β 0 + β 1 x

(1)Yзнак равноβ0+β1Икс1++βКИксК+ε
εY*Y
езнак равноY-Y*
(2)Yзнак равноβ0+β1Икс1++βКИксК+е+ε
Поскольку наблюдаются, мы можем оценить модель по OLS. Если ошибка измерения в y статистически не зависит от каждой объясняющей переменной, то ( e + ε ) имеет те же свойства, что и ε, и обычные процедуры вывода OLS ( статистика t и т. Д.) Являются действительными. Тем не менее, в вашем случае я бы ожидал увеличения дисперсии е . Вы можете использовать:Y,Икс1,...,ИксКY(е+ε)εTе
  • оценщик взвешенных наименьших квадратов (например, Kutner et al. , §11.1; Verbeek , §4.3.1-3);

  • оценщик OLS, который по-прежнему является беспристрастным и непротиворечивым, и стандартные ошибки, совместимые с гетероскедастичностью, или просто стандартные ошибки Wite ( Verbeek , §4.3.4).

Погрешность измерения в независимой переменной

ИксК*ИксК

еКзнак равноИксК-ИксК*
  • Cov(ИксК,еК)знак равно0ИксК*ИксК*знак равноИксК-еК

    Yзнак равноβ0+β1Икс1++βКИксК+(ε-βКеК)
    εеИксJИксК
  • Cov(ИксК*,ηК)знак равно0ИксКYИкс1,...,ИксК

Насколько я могу догадаться, глядя на ваш график (ошибки сосредоточены на «истинных» значениях независимой переменной), первый сценарий может быть применен.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.