Указание модели разницы в различиях с несколькими периодами времени


20

Когда я оцениваю модель разности различий с двумя периодами времени, эквивалентная модель регрессии

а. Yist=α+γsTreatment+λdt+δ(Treatmentdt)+ϵist

  • где Treatment - манекен, равный 1, если наблюдение относится к группе лечения
  • и представляет собой манекен, который равен 1 в период времени после того, как лечение произошлоd

Таким образом, уравнение принимает следующие значения.

  • Контрольная группа, до лечения: α
  • Контрольная группа, после лечения: α+λ
  • Группа лечения, до лечения: α+γ
  • Группа лечения, после лечения: α+γ+λ+δ

Следовательно, в двухпериодной модели разница в оценке разностей равна .δ

Но то , что происходит в отношении , если у меня есть больше чем один до и после периода лечения? Я все еще использую манекен, который указывает, является ли год до или после лечения?dt

Или я вместо этого добавляю манекены без указания того, относятся ли каждый год к периоду до или после лечения? Как это:

б. Yist=α+γsTreatment+yeardummy+δ(Treatmentdt)+ϵist

Или я могу включить оба (т. )?yeardummy+λdt

с. Yist=α+γsTreatment+yeardummy+λdt+δ(Treatmentdt)+ϵist

В заключение, как мне указать модель разницы в различиях с несколькими периодами времени (a, b или c)?


1
Вы обычно используете модель б. Обратите внимание, что в модели c, будет идеально коллинеарен с манекенами года, поэтому модель не может быть оценена. dt
standard_error

Было бы здорово, если бы вы могли объяснить, почему b обычно используется. Может быть, дать некоторые ссылки, или просто дать объяснение в 2 предложениях.
mpiktas

и в модели б. Вы могли бы добавить непрерывную переменную для года вместо манекенов? Как интерпретация коэффициентов будет отличаться в этих случаях?

Ответы:


19

Типичным способом оценки разницы в модели различий с более чем двумя периодами времени является предлагаемое вами решение б). Сохраняя свою запись, вы бы регрессировали где D tОбработка sd t - фиктивная переменная, которая равен единице для лечебных единиц с

Yist=α+γs(Treatments)+λ(year dummyt)+δDst+ϵist
DtTreatmentsdtsв период после лечения ( ) и ноль в противном случае. Обратите внимание, что это более общая формулировка различия в регрессии различий, которая учитывает разные сроки лечения для разных обработанных единиц.dt=1

Как было указано правильно в комментариях, предложенное вами решение в) не работает из-за коллинеарности с временными манекенами и манекеном для периода после лечения. Тем не менее, небольшим вариантом этого оказывается проверка надежности. Пусть и γ s 1 - два набора фиктивных переменных для каждого блока управления s 0 и каждого обработанного блока s 1 , соответственно, затем взаимодействие макетов для обработанных блоков с переменной времени t и регрессия Y i s t = γ s 0 + γ s 1 +γs0γs1s0s1t включает в себя единичную временную тенденцию γ s 1 t . Если вы включите эти единичные временные тренды, а коэффициент разности разностей δ существенно не изменится, вы сможете быть более уверенными в своих результатах. В противном случае вы можете задаться вопросом, поглотил ли ваш лечебный эффект различия между обработанными единицами из-за базовой временной тенденции (это может произойти, когда политики вступают в силу в разные моменты времени).

Yist=γs0+γs1t+λ(year dummyt)+δDst+ϵist
γs1tδ

Примером, приведенным в работе «Angrist and Pischke» (2009) «Mostly Harmless Econometrics», является исследование политики рынка труда Besley and Burgess (2004) . В их статье так получилось, что включение трендов по времени для конкретного штата убивает предполагаемый эффект лечения. Обратите внимание, что для этой проверки надежности вам нужно более 3-х периодов.


Продолжение, так как я пытаюсь решить, подходит ли реализация этого с некоторыми административными данными: Вы бы сказали, что подход DD более обоснован, чем проект CITS, если в модели есть только 4 момента времени (2 до и 2 поста)? Кроме того, если у меня есть несколько когорт в волнах данных, должны ли они рассматриваться отдельно или в единой модели? Благодарю.
bfoste01

@Andy: Можете ли вы объяснить, что вы подразумеваете под s0, s1 и временным трендом для конкретного юнита? Предполагая, что у меня есть две газеты (WPT и NYT) и WPT - моя группа лечения, какие из них будут s0 и s1?
user3683131

1
Правильно ли я считаю, что этот анализ сравнивает средние показатели до и после лечения и не учитывает светские тенденции? т. е. если d_t = 0 для всех периодов времени до точки переключения и d_t = 1 для всех периодов времени после, то этот анализ по существу совпадает с двумя периодами один, за исключением того, что среднее значение берется из всех до и после времени периоды. Какие-либо временные тенденции в результате до / после смены лечения игнорируются? Я пытаюсь решить, подходит ли модель DiD для анализа, который я планирую провести.
AP30

0

Я хотел бы кое-что уточнить (и косвенно ответить на вопрос в комментариях). В частности, это касается использования единичных линейных трендов времени. В качестве проверки надежности может показаться, что вы взаимодействуете с манекенами только для обработанных единиц (т.е.γ1s) с непрерывным временным трендом. Однако на самом деле это тот случай, когда вы взаимодействуете с полным набором манекенов юнитов / состояний (фиксированные эффекты юнитов / состояний) с линейной переменной тренда времени.

Angrist и Pischke (2009) рекомендуют этот подход на стр. 238 в журнале « В основном безвредная эконометрика» . Различия в обозначениях могут вызвать путаницу. Воспроизведение спецификации 5.2.7:

yist=γ0s+γ1st+λt+δDst+Xistβ+εist,

where γ0s is a state-specific intercept, in accordance with the s subscript used in their book. You can view γ1s as the state-specific trend coefficient multiplying the time trend variable, t. Different papers use different notation. For example, Wolfers (2006) replicates a model incorporating state-specific linear time trends. Reproducing model (1):

ys,t=sStates+tYeart+sStatesTimet+δDs,t+εs,t,

where the model includes state and year fixed effects (i.e., dummies for each state and year). The treatment variable Ds,t is when state s adopts a unilateral divorce regime in period t. Notice this specification interacts state dummies with a linear time trend (i.e., Timet). This is yet another representation of state-specific linear time trends in your model specification.

Unit-specific linear time trends is also addressed in another post (see below):

How to account for endogenous program placement?

In sum, you want to interact all unit (group) dummies with a continuous time trend variable.

Paper by Justin Wolfers is below for your reference:

https://users.nber.org/~jwolfers/papers/Divorce(AER).pdf

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.