Ответ JohnRos очень хороший. Проще говоря, эндогенность означает, что вы неправильно поняли причину. То, что модель, которую вы записали и оценили, неправильно отражает то, как причинная связь работает в реальном мире. Когда вы пишете:
Yя=β0+β1Xi+ϵi
Вы можете думать об этом уравнении несколькими способами. Вы можете думать об этом как об удобном способе предсказания на основе значенийВы можете думать об этом как об удобном способе моделирования . В любом из этих случаев нет такой вещи как эндогенность, и вам не нужно беспокоиться об этом.X E { Y | X }YXE{Y|X}
Тем не менее, вы также можете думать об уравнении как о воплощении причинно-следственной связи. Вы можете думать о как об ответе на вопрос: «Что случилось бы с если бы я добрался до этой системы и экспериментально увеличил на 1?» Если вы хотите думать об этом таким образом, использование OLS для оценки этого означает, что: Y Xβ1YX
- YX вызываетY
- Yϵ вызываетY
- Xϵ не вызываетX
- XY не вызываетX
- Ничто, вызывающее также не вызываетXϵX
Сбой любого из 3-5 обычно приводит к или, что не совсем эквивалентно, . Инструментальные переменные - это способ исправить тот факт, что вы неправильно поняли причину (сделав другое, другое, причинное предположение). Отлично проведенное рандомизированное контролируемое исследование - это способ заставить 3-5 быть правдой. Если вы выберете случайно, то это, безусловно, не вызвано , или чем-то еще. Так называемые методы «естественного эксперимента» - это попытки найти особые обстоятельства в мире, где 3-5 верны, даже если мы не думаем, что 3-5 обычно верны.C o v ( X , ϵ ) ≠ 0 X Y ϵE{ϵ|X}≠0Cov(X,ϵ)≠0XYϵ
В примере JohnRos для расчета величины заработной платы в сфере образования вам нужна причинно-следственная интерпретация , но есть веские основания полагать, что 3 или 5 неверно.β1
Ваше замешательство понятно, хотя. На курсах по линейной модели очень характерно, чтобы преподаватель использовал причинную интерпретацию я дал выше, делая вид, что не вводит причинно-следственную связь, притворяясь, что «это всего лишь статистика». Это трусливая ложь, но она также очень распространена. β1
На самом деле, это часть более крупного явления в биомедицине и общественных науках. Почти всегда мы пытаемся определить причинное влияние на - в этом и заключается наука. С другой стороны, это также почти всегда тот случай, когда есть какая-то история, которую вы можете рассказать, которая приводит к выводу, что один из 3-5 является ложным. Таким образом, существует некая практичная, двусмысленная недобросовестность, в которой мы отбрасываем возражения, говоря, что мы просто выполняем ассоциативную работу, а затем скрываем причинную интерпретацию в другом месте (обычно в разделах введения и заключения статьи).YXY
Если вам действительно интересно, читайте парня по имени Иудея Перл. Джеймс Хекман тоже хорош.
R
.