2SLS но второй этап Probit


15

Я пытаюсь использовать анализ инструментальных переменных, чтобы сделать вывод причинно-следственной связи с данными наблюдений.

Я столкнулся с двухэтапной регрессией наименьших квадратов (2SLS), которая, вероятно, решит проблему эндогенности в моих исследованиях. Тем не менее, я хотел бы, чтобы первый этап был OLS, а второй этап - пробит внутри 2SLS. Основываясь на моем чтении и поиске, я обнаружил, что исследователи используют либо 2SLS, либо пробил первого этапа, либо OLS второго этапа, но не наоборот, чего я и пытаюсь достичь.

В настоящее время я использую Stata и команда ivreg в Stata для прямой 2SLS.

Ответы:


12

Ваш случай менее проблематичен, чем наоборот. Операторы ожиданий и линейных проекций проходят линейную первую стадию (например, OLS), но не проходят нелинейные, такие как пробит или логит. Следовательно, это не проблема, если вы сначала регрессируете свою непрерывную эндогенную переменную на своем инструменте (ах) , а затем используете подходящие значения в пробитной второй стадии для оценки ИксZ

Иксязнак равноa+Zя'π+ηя
Pr(Yязнак равно1|Икс^я)знак равноPr(βИкс^я+εя>0)

Стандартные ошибки не будут правильными, потому что - не случайная переменная, а оценочная величина. Вы можете исправить это, загрузив первый и второй этап вместе. В Stata это было бы что-то вродеИкс^я

// use a toy data set as example
webuse nlswork

// set up the program including 1st and 2nd stage
program my2sls
    reg grade age race tenure
    predict grade_hat, xb

    probit union grade_hat age race
    drop grade_hat
end

// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls

В этом примере мы хотим оценить влияние многолетнего образования на вероятность вступления в профсоюз. Учитывая, что годы обучения, вероятно, будут эндогенными, на первом этапе мы обеспечиваем его годами обучения. Конечно, это не имеет никакого смысла с точки зрения интерпретации, но иллюстрирует код.

Просто убедитесь, что вы используете одни и те же внешние управляющие переменные как на первом, так и на втором этапе. В приведенном выше примере это те, в age, raceто время как (бессмысленный) инструмент tenureесть только на первом этапе.


Большое спасибо, это решило проблему, с которой я столкнулся. Еще раз спасибо.
Вероника

1
На самом деле исследования предлагают использовать подход функции управления для нелинейных моделей, таких как логит, который будет заключаться в использовании остатков из первой стадии вместе с эндогенной переменной, а не в прогнозных значениях. Несмотря на то, что, похоже, достижения часто происходят, см .: stat.wharton.upenn.edu/~zijguo/…
robin.datadrivers

1
Извините, я не привел цитату для сравнения двух подходов для линейных и нелинейных моделей. ncbi.nlm.nih.gov/pmc/articles/PMC2494557
robin.datadrivers

-1 Мне пришлось понизить этот ответ, так как, по-видимому, невозможно перенести идею оценки 2SLS на нелинейные модели на первом и / или втором этапе. Это может быть верно для случая 1-го этапа LS и 2-го этапа пробита (@ А у вас есть ссылка, чтобы поддержать это?), Но по крайней мере предостережение в порядке, поскольку я видел, что многие люди делают идею 2SLS во всех видах случаев нелинейных моделей на первом и втором этапе, что является проблематичной практикой.
Момо
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.