Согласованность 2SLS с двоичной эндогенной переменной

Я читал, что оценка 2SLS по-прежнему соответствует даже двоичной эндогенной переменной ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). На первом этапе вместо линейной модели будет запущена пробная модель лечения.

Существуют ли какие-либо формальные доказательства, подтверждающие, что 2SLS по-прежнему непротиворечив, даже если 1-й этап представляет собой модель пробит или логит?

И что делать, если результат также двоичный? Я понимаю, что если у нас есть двоичный результат и двоичная эндогенная переменная (1-й и 2-й этапы представляют собой двоичные модели пробит / логит), то имитация метода 2SLS приведет к противоречивой оценке. Есть ли формальное доказательство этому? В эконометрической книге Вулдриджа есть некоторая дискуссия, но я думаю, что нет строгого доказательства, чтобы показать несоответствие.

data sim;
     do i=1 to 500000;
        iv=rand("normal",0,1);
             x2=rand("normal",0,1);
        x3=rand("normal",0,1);
        lp=0.5+0.8*iv+0.5*x2-0.2*x3;
        T=rand("bernoulli",exp(lp)/(1+exp(lp)));
        Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
        output;
     end;
     run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
     model T=IV;
     output out=pred1 pred=p;
     run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
     model y=p;
     run;

коэффициент p = 1.19984. Я запускаю только одну симуляцию, но с большим размером выборки.

probit instrumental-variables endogeneity

— Винсент
источник

Вам не нужно добавлять ссылку = пробит в оператор модели?

— Майк Хантер

Был подобный вопрос относительно первой стадии пробита и второй стадии OLS. В ответе я предоставил ссылку на заметки, которые содержат формальное доказательство несостоятельности этой регрессии, которая формально известна как «запрещенная регрессия», как ее назвал Джерри Хаусман. Основная причина несогласованности подхода пробная первая стадия / вторая стадия OLS заключается в том, что ни оператор ожиданий, ни оператор линейных проекций не проходят нелинейную первую стадию. Поэтому установленные значения из пробита первой ступени не коррелируют только с ошибкой второй ступени при очень ограничительных допущениях, которые практически никогда не выполняются на практике. Имейте в виду, что формальное доказательство несостоятельности запрещенной регрессии является довольно сложным, если я правильно помню.

Если у вас есть модель где

Y_{я} знак равно α + β {Икс}_{я} + ε_{я}

$Y_i = \alpha + \beta X_i + \epsilon_i$

Y_{i}

$Y_i$

X_{i}

$X_i$

{Икс}_{я} знак равно a + Z_{я}^{'} π + η_{я}

$X_i = a + Z'_i\pi + \eta_i$

{\hat{X}}_{i}

$\widehat{X}_i$

X_{i}

$X_i$

X_{i}

$X_i$

$Y_i$

Для более подробного обсуждения этого взгляните на отличные конспекты лекций Кит Баум по этой теме. На слайде 7 он обсуждает использование линейной вероятностной модели в контексте 2SLS.

Наконец, если вы действительно хотите использовать пробит, потому что вам нужны более эффективные оценки, то есть другой способ, который также упоминается в работе Wooldridge (2010) «Эконометрический анализ данных поперечных сечений и панелей». Приведенный выше ответ включает его, повторяю здесь для полноты. В качестве прикладного примера см. Adams et al. (2009), которые используют трехэтапную процедуру, которая выглядит следующим образом:

использовать пробит для регрессии эндогенной переменной на инструменте (ах) и экзогенных переменных
используйте предсказанные значения из предыдущего шага на первом этапе OLS вместе с экзогенными (но без инструментальных) переменных
сделать второй этап как обычно

Эта процедура не относится к проблеме запрещенной регрессии, но потенциально обеспечивает более эффективные оценки вашего параметра интереса.

— Энди
источник

Привет Энди, спасибо за твой ответ. Вы предлагаете "несоответствие подхода первой стадии / второй стадии МНК"? Это не то, что я прочитал в ссылке, которую я дал. Подход Probit first stage / OLS second stage называется последовательным.

— Винсент

Это не то, что говорит пост Statalist. Если вы посмотрите на раздел «методы и формулы» для команды Treatreg (который теперь называется etregress) в документации, вы увидите, что двухступенчатый оценщик - это не 2SLS с пробитами первой ступени / OLS второй ступени. Вместо этого пробит сначала используется для получения коэффициентов опасности, которые затем используются в регрессии МНК для получения согласованных оценок.

— Энди

Спасибо, Энди. Становится интересно. Похоже, имитирующий 2SLS с пробит-моделью на 1-м этапе не принимается. Я прочитаю «запрещающий регресс» по тем или иным причинам. Кстати, я попробовал симуляцию с использованием SAS, и результаты не выглядят плохо для 2SLS с пробитом 1st / ols 2nd.

— Винсент

Я размещаю код в основном вопросе и хотел бы услышать ваши комментарии. Спасибо!

— Винсент