Ваш случай менее проблематичен, чем наоборот. Операторы ожиданий и линейных проекций проходят линейную первую стадию (например, OLS), но не проходят нелинейные, такие как пробит или логит. Следовательно, это не проблема, если вы сначала регрессируете свою непрерывную эндогенную переменную на своем инструменте (ах) ,
а затем используете подходящие значения в пробитной второй стадии для оценки
ИксZ
Икся= + Z'яπ+ ηя
Pr ( Yя= 1 | Иксˆя) = Pr ( βИксˆя+ ϵя> 0 )
Стандартные ошибки не будут правильными, потому что - не случайная переменная, а оценочная величина. Вы можете исправить это, загрузив первый и второй этап вместе. В Stata это было бы что-то вродеИксˆя
// use a toy data set as example
webuse nlswork
// set up the program including 1st and 2nd stage
program my2sls
reg grade age race tenure
predict grade_hat, xb
probit union grade_hat age race
drop grade_hat
end
// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls
В этом примере мы хотим оценить влияние многолетнего образования на вероятность вступления в профсоюз. Учитывая, что годы обучения, вероятно, будут эндогенными, на первом этапе мы обеспечиваем его годами обучения. Конечно, это не имеет никакого смысла с точки зрения интерпретации, но иллюстрирует код.
Просто убедитесь, что вы используете одни и те же внешние управляющие переменные как на первом, так и на втором этапе. В приведенном выше примере это те, в age, race
то время как (бессмысленный) инструмент tenure
есть только на первом этапе.