Это очень стандартный вопрос об инструментальных переменных линейных моделей с одним уравнением. Учитывая примитивы вашего вопроса, единственной эндогенной переменной является упражнение . Чтобы ответить на этот конкретный вопрос, вам нужна экзогенная переменная z , которая удовлетворяет двум условиям:
- СОУ (г, и) = 0.
- Должна быть связь между эндогенной переменной и этой экзогенной переменной, которую вы предлагаете, но она не была частью истинной постулированной модели (структурной модели). Другими словами,
с , и ортогонально всем вашим объясняющим переменным (кроме упражнений) и z.
exercise=β0+β1age+β2weight+β3height+β4male+β5work+ϕz+εexercise
ϕ≠0E(εexercise)=0
Прежде чем двигаться дальше, замечание. Под структурной моделью я подразумеваю, следуя соглашению Вулдриджа и Голдбергера, постулированную модель. То есть модель, которая устанавливает причинно-следственную связь между здоровьем и вашими ковариатами. Это ключевое различие и несогласие с предыдущими ответами.
Теперь, возвращаясь к рассматриваемой проблеме, условие 2 - это то, что в литературе по уравнениям одновременности называется уравнением приведенной формы , которое представляет собой не что иное, как линейную проекцию эндогенного на все экзогенные переменные, включая z.
Теперь подключите сокращенную форму к вашей постулированной модели, и вы получите
health=α0+α1age+α2weight+α3height+α4male+α5work+δz+ν
где , и . По определению линейной проекции, не коррелирует со всеми объясняющими переменными, и, следовательно, OLS этого последнего уравнения будет давать непротиворечивые оценки для и , а не базового в истинной модели.
αi=bi+b6βi,∀i∈{1,…,5}δ=b6ϕν=u+b6εexerciseναiδbi
Идентификация требует небольшого количества манипуляций в матричной форме, но по существу она сводится к так называемому условию ранга . Определите и так, чтобы ваша структурная модель была . Теперь определите . По условию 1 (cov (z, u) = 0, так что E (z, u) = 0),
если умножить бот-стороны структурной модели на и ожидайте, что у вас есть
Состояние ранга гласит, чтоb=(b0,…,b6)′x=(1,age,…,exercise)′health=x′b+uz≡(1,age,…,work,z)′
E(zu)=0
zE(zx′)b=E(zy)
E(zx′)полный ранг столбца. В этом конкретном примере и при заданных условиях на z это эквивалентно Поэтому мы имеем 6 уравнений в 6 неизвестных. Следовательно, существует единственное решение для системы, т.е. идентифицировано и равно , по желанию.
rank(E(zx′)=6b[E(zx′)]−1E(zy)
Примечания: Условие 1 полезно для получения условия момента, но модель приведенной формы с имеет решающее значение для условия ранга. Оба условия обычные.ϕ
На данный момент должно быть понятно, зачем нам это нужно. С одной стороны, без z OLS оценщик истинной модели будет давать противоречивые оценки не только для но и для всех . С другой стороны (и в некоторой степени связанные), наши параметры уникально идентифицируются, поэтому мы уверены, что оцениваем истинную причинную связь, как указано в нашей истинной модели.b6bi
Что касается тестирования, условие 2 (z и упражнение частично коррелированы) можно проверить напрямую, и вы всегда должны сообщать об этом шаге вопреки комментарию в предыдущем ответе. В отношении этого шага существует огромная литература, особенно литература о слабых инструментах.
Тем не менее, второе условие не может быть проверено напрямую. Иногда вы можете использовать экономическую теорию для обоснования или предоставления альтернативных гипотез, поддерживающих использование z.