Я читал, что оценка 2SLS по-прежнему соответствует даже двоичной эндогенной переменной ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). На первом этапе вместо линейной модели будет запущена пробная модель лечения.
Существуют ли какие-либо формальные доказательства, подтверждающие, что 2SLS по-прежнему непротиворечив, даже если 1-й этап представляет собой модель пробит или логит?
И что делать, если результат также двоичный? Я понимаю, что если у нас есть двоичный результат и двоичная эндогенная переменная (1-й и 2-й этапы представляют собой двоичные модели пробит / логит), то имитация метода 2SLS приведет к противоречивой оценке. Есть ли формальное доказательство этому? В эконометрической книге Вулдриджа есть некоторая дискуссия, но я думаю, что нет строгого доказательства, чтобы показать несоответствие.
data sim;
do i=1 to 500000;
iv=rand("normal",0,1);
x2=rand("normal",0,1);
x3=rand("normal",0,1);
lp=0.5+0.8*iv+0.5*x2-0.2*x3;
T=rand("bernoulli",exp(lp)/(1+exp(lp)));
Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
output;
end;
run;
****1st stage: logit model ****;
****get predicted values ****;
proc logistic data=sim descending;
model T=IV;
output out=pred1 pred=p;
run;
****2nd stage: ols model with predicted values****;
proc reg data=pred1;
model y=p;
run;
коэффициент p = 1.19984
. Я запускаю только одну симуляцию, но с большим размером выборки.