Является ли справедливая идентификация 2SLS несмещенной?

В книге « В основном безвредная эконометрика: спутник эмпирика» (Angrist and Pischke, 2009: стр. 209) я прочитал следующее:

(...) На самом деле, только что идентифицированный 2SLS (скажем, простой оценщик Вальда) примерно беспристрастен . Это трудно показать формально, потому что только что идентифицированный 2SLS не имеет моментов (то есть, распределение выборки имеет жирные хвосты). Тем не менее, даже со слабыми инструментами, только что идентифицированный 2SLS приблизительно центрирован там, где и должен быть. Поэтому мы говорим, что только что идентифицированный 2SLS является несмещенным по медиане. (...)

Хотя авторы говорят, что только что идентифицированный 2SLS является несмещенным по медиане, они не доказывают это и не дают ссылку на доказательство . На странице 213 они снова упоминают предложение, но без ссылки на доказательство. Кроме того, я не могу найти мотивацию для предложения в их лекционных заметках об инструментальных переменных из MIT , стр. 22.

Причиной может быть то, что предложение является ложным, поскольку они отклоняют его в заметке в своем блоге . Тем не менее, только что идентифицированный 2SLS примерно несмещен по медиане, пишут они. Они мотивируют это, используя небольшой эксперимент Монте-Карло, но не предоставляют аналитического доказательства или выражения в замкнутой форме члена ошибки, связанного с приближением. Так или иначе, это был ответ авторов профессору Гэри Солону из Университета штата Мичиган, который сделал комментарий, что только что идентифицированный 2SLS не является беспристрастным по медиане.

Вопрос 1: Как вы можете доказать, что только что идентифицированный 2SLS не является несмещенным по медиане, как утверждает Гэри Солон?

Вопрос 2: Как вы доказываете, что только что идентифицированный 2SLS примерно несмещен по медиане, как утверждают Ангрист и Пишке?

По Вопросу 1 я ищу контрпример. По Вопросу 2 я (в первую очередь) ищу доказательство или ссылку на доказательство.

Я также ищу формальное определение средне-объективного в этом контексте. Я понимаю эту концепцию следующим образом: оценщик of основанный на некотором множестве из случайных величин, является несмещенным по медиане для тогда и только тогда если распределение имеет медиану . $\hat{\theta}(X_{1:n})$ $\theta$ $X_{1:n}$ $n$ $\theta$ $\hat{\theta}(X_{1:n})$ $\theta$

Примечания

В только что определенной модели число эндогенных регрессоров равно количеству инструментов.
Структура, описывающая только что идентифицированную модель инструментальных переменных, может быть выражена следующим образом: Причинно-следственная модель и уравнение первого этапа представляют собой где - матрица описывающая эндогенных регрессоров, и где инструментальные переменные описываются матрицей , Здесь просто описывает некоторое количество управляющих переменных (например, добавленных для повышения точности); и и - термины ошибки.
$\begin{matrix} (1) & {\begin{cases} Y & = X β + W γ + u \\ X & = Z δ + W ζ + v \end{cases} \end{matrix}$ $\begin{cases} Y&=X\beta+W\gamma+u \\ X&=Z\delta+W\zeta+v \end{cases}\tag{1}$ $X$ $k\times n+1$ $k$ $k\times n+1$ $Z$ $W$ $u$ $v$
Мы оцениваем в используя 2SLS: во-первых, регрессия на контролирующая и получение предсказанных значений ; это называется первый этап. Во-вторых, регресс на контролирующий ; это называется второй этап. Расчетный коэффициент для на втором этапе является нашей оценкой 2SLS для . $\beta$ $(1)$ $X$ $Z$ $W$ $\hat{X}$ $Y$ $\hat{X}$ $W$ $\hat{X}$ $\beta$
В простейшем случае мы имеем модель и эндогенный регрессор с помощью . В этом случае оценка 2SLS для равна где обозначает образец ковариации между и . Мы можем упростить : где , и
$y_{i} = α + β x_{i} + u_{i}$ $y_i=\alpha+\beta x_i+u_i$ $x_i$ $z_i$ $\beta$ $\begin{matrix} (2) & {\hat{β}}^{2SLS} = \frac{s_{Z Y}}{s_{Z X}}, \end{matrix}$ $\hat{\beta}^{\text{2SLS}}=\frac{s_{ZY}}{s_{ZX}}\tag{2},$ $s_{AB}$ $A$ $B$ $(2)$ $\begin{matrix} (3) & {\hat{β}}^{2SLS} = \frac{\sum_{i} (y_{i} - \bar{y}) z_{i}}{\sum_{i} (x_{i} - \bar{x}) z_{i}} = β + \frac{\sum_{i} (u_{i} - \bar{u}) z_{i}}{\sum_{i} (x_{i} - \bar{x}) z_{i}} \end{matrix}$ $\hat{\beta}^{\text{2SLS}}=\frac{\sum_i(y_i-\bar{y})z_i}{\sum_i(x_i-\bar{x})z_i}=\beta+\frac{\sum_i(u_i-\bar{u})z_i}{\sum_i(x_i-\bar{x})z_i}\tag{3}$ $\bar{y}=\sum_iy_i/n$ $\bar{x}=\sum_i x_i/n$ $\bar{u}=\sum_i u_i/n$ где - количество наблюдений. $n$
Я провел поиск литературы, используя слова «только что идентифицированный» и «несмещенный по медиане», чтобы найти ссылки, отвечающие на вопросы 1 и 2 (см. Выше). Я не нашел ни одного. Все статьи, которые я нашел (см. Ниже), ссылаются на Angrist and Pischke (2009: стр. 209, 213), когда утверждают, что только что идентифицированный 2SLS является несмещенным по медиане.
- Jakiela, P., Miguel, E. & Te Velde, VL (2015). Вы заслужили это: оценивая влияние человеческого капитала на социальные предпочтения. Экспериментальная экономика , 18 (3), 385-407.
- An, W. (2015). Инструментальные оценки переменных влияния сверстников в социальных сетях. Социологические исследования , 50, 382-394.
- Vermeulen W. & Van Ommeren J. (2009). Формирует ли планирование землепользования региональную экономику? Одновременный анализ предложения жилья, внутренней миграции и роста местной занятости в Нидерландах. Журнал Жилищного хозяйства , 18 (4), 294-310.
- Aidt, TS & Leon, G. (2016). Демократическое окно возможностей: свидетельство беспорядков в странах Африки к югу от Сахары. Журнал разрешения конфликтов , 60 (4), 694-717.

— Элиас
источник

Я не мог ответить на это формальным доказательством, а скорее проведением имитационных исследований, показывающих, что LIML является медианой несмещенной (плюс определение), и что LIML и 2SLS с одной эндогенной переменной и одним инструментом имеют одинаковое распределение малых выборок (следовательно, если LIML в этом случай является средне-несмещенным, тогда как 2SLS). Будет ли этого достаточно, чтобы ответить на ваш вопрос?

— Энди

@ Энди Это был бы действительно хороший ответ! Может быть достаточно, в зависимости от того, что могут сказать другие пользователи. Вероятно, этого достаточно, так как я думаю, что нет никаких доказательств того, что только что идентифицированный 2SLS является приблизительно несмещенным по медиане. Было бы неплохо с контрпримером, показывающим, что только что идентифицированный 2SLS не является несмещенным по медиане; но я думаю, что можно (но может быть трудно) придумать сам контрпример.

— Элиас

Приблизительно беспристрастно, вы имеете в виду, что смещение стремится к нулю как некоторая функция от числа наблюдений, таких как 1 / n или 1 / n ^ 2 и т. Д.?

— Игорь

@Igor Фраза "приблизительно беспристрастный по медиане" не используется мной. Поскольку я не знаю, что формально означает «непредвзятый срединный», я не могу ответить на ваш вопрос. Но то, о чем вы, кажется, думаете, это асимптотически непредвзятая оценка .

— Элиас

В исследованиях по моделированию термин медианное смещение относится к абсолютной величине отклонений оценки от ее истинного значения (которое вы знаете в данном случае, потому что это моделирование, поэтому вы выбираете истинное значение). Вы можете увидеть рабочий документ Янга (2017), который определяет медианное смещение, подобное этому, в таблице 15, или Эндрюса и Армстронга (2016), который строит графики медианного смещения для разных оценок на рисунке 2.

Часть путаницы (также в литературе), кажется, происходит из-за того, что есть две отдельные лежащие в основе проблемы:

слабые инструменты
много (потенциально) слабых инструментов

Проблема наличия слабого инструмента в только что определенной обстановке сильно отличается от наличия многих инструментов, где некоторые из них являются слабыми, однако иногда эти две проблемы объединяются.

Прежде всего, давайте рассмотрим отношения между оценками, о которых мы здесь говорим. Theil (1953) в статье «Оценка и одновременная корреляция в системах полных уравнений» представил так называемую оценку -klass: $\kappa$

\hat{β} = {[X^{'} (I - κ M_{Z}) X]}^{- 1} [X^{'} (I - κ M_{Z})_{y})]

$\widehat{\beta} = \left[ X'(I-\kappa M_Z)X \right]^{-1}\left[ X'(I-\kappa M_Z)_y) \right]$

с для системы уравнений $M_Z = I-Z(Z'Z)^{-1}Z'$

\begin{aligned} y & = X β + u \\ X & = Z π + e . \end{aligned}

$\begin{align} y &= X\beta + u \\ X &= Z\pi + e. \end{align}$

Скаляр определяет, какую оценку мы имеем. Для вы возвращаетесь к OLS, для вас есть оценщик 2SLS, а когда для задан наименьший корень из вы иметь оценку LIML (см. Stock and Yogo, 2005 , p. 111) $\kappa$ $\kappa = 0$ $\kappa = 1$ $\kappa$ $\det (X'X - \kappa X'M_ZX))=0$

Асимптотически LIML и 2SLS имеют одинаковое распределение, однако в небольших выборках это может сильно отличаться. Это особенно верно, когда у нас много инструментов и некоторые из них слабые. В этом случае LIML работает лучше, чем 2SLS. Показано, что LIML является средне непредвзятым. Этот результат получен в результате ряда имитационных исследований. Обычно в работах, в которых указывается этот результат, упоминаются Ротберг (1983) «Асимптотические свойства некоторых оценщиков в структурных моделях», Сава (1972) или Андерсон и др. (1982) .

Стив Пишке приводит симуляцию этого результата в своих заметках 2016 года на слайде 17, где показано распределение OLS, LIML и 2SLS с 20 инструментами, из которых только один действительно полезен. Истинное значение коэффициента равно 1. Вы видите, что LIML центрируется по истинному значению, в то время как 2SLS смещен в сторону OLS.

Теперь аргумент выглядит следующим образом: учитывая, что LIML может быть показан как медиана несмещенной и что в только что идентифицированном случае (одна эндогенная переменная, один инструмент) LIML и 2SLS эквивалентны, 2SLS также должен быть медианой несмещенной.

Однако, кажется, что люди снова смешивают случай «слабого инструмента» и «многих слабых инструментов», потому что в только что определенной настройке и LIML, и 2SLS будут смещены, когда инструмент слабый. Я не видел никакого результата, когда было продемонстрировано, что LIML беспристрастен в только что идентифицированном случае, когда инструмент слаб, и я не думаю, что это правда. Аналогичный вывод выходит из Angrist и Pischke лет (2009) ответа Гари Соло на странице 2 , где они имитируют смещение МНКА, 2МНК и LIML при изменении силы прибора.

Для очень малых коэффициентов первой ступени <0,1 (с фиксированной стандартной ошибкой), т. Е. Низкой прочности прибора, только что идентифицированный 2SLS (и, следовательно, только идентифицированный LIML) намного ближе к пределу вероятности оценки OLS по сравнению с истинное значение коэффициента 1.

Как только коэффициент первой ступени находится между 0,1 и 0,2, они отмечают, что статистика F первой ступени выше 10, и, следовательно, больше нет проблем со слабым инструментом в соответствии с эмпирическим правилом F> 10 по Stock и Yogo (2005). В этом смысле я не вижу, как LIML должен быть решением проблемы слабого инструмента в только что идентифицированном случае. Также обратите внимание, что i) LIML имеет тенденцию быть более рассредоточенным и требует исправления своих стандартных ошибок (см. Bekker, 1994) и ii) если ваш инструмент действительно слабый, вы не найдете ничего на втором этапе ни с 2SLS, ни с LIML потому что стандартные ошибки просто будут слишком большими.

— Энди
источник

Спасибо за ответ! Это сделало все намного понятнее для меня.

— Элиас