Когда использовать фиксированные эффекты и кластерные SE?

19

Предположим, у вас есть единое сечение данных, где отдельные лица находятся в группах (например, учащиеся в школах), и вы хотите оценить модель формы, в Y_i = a + B*X_iкоторой Xесть вектор характеристик индивидуального уровня и aконстанта.

В этом случае предположим, что ненаблюдаемая неоднородность между группами смещает ваши точечные оценки Bи их SE, поскольку она коррелирует с вашей независимой переменной, представляющей интерес.

Одним из вариантов является кластеризация ваших SE по группам (школам). Другим является включение групповых ИП. Другое - использовать оба. Что следует учитывать при выборе между этими вариантами? Особенно неясно, почему можно кластеризовать SE по группам и использовать группу FE. В моем конкретном случае у меня есть 35 групп и 5000 человек, вложенных в каждую группу. Я следил за обсуждением в этом pdf , но не очень понятно, почему и когда можно использовать как кластеризованные SE, так и фиксированные эффекты.

(Пожалуйста, обсудите плюсы и минусы кластерных SE против FE, вместо того, чтобы предлагать мне просто подойти к многоуровневой модели.)

— Вопрос ответ
источник

22

Оба подхода, использующие групповые фиксированные эффекты и / или скорректированную на кластерах стандартную ошибку, учитывают различные проблемы, связанные с кластерными (или панельными) данными, и я бы четко рассматривал их как отдельные подходы. Часто вы хотите использовать оба из них:

Прежде всего, скорректированная на кластеры стандартная ошибка учитывает внутрикластерную корреляцию или гетероскедастичность, которую оценщик с фиксированными эффектами не учитывает, если только вы не хотите делать дополнительные предположения, см. Слайды лекций Имбенса и Вулдриджа для хорошего обсуждения кратких и длинные панели и различные вопросы, связанные с этой проблемой . Кэмерон и Миллер также опубликовали новую статью на эту тему: «Практическое руководство по кластерно-устойчивому выводу», которая может быть вам интересна. Если вы не хотите моделировать дисперсионно-ковариационную матрицу и подозреваете, что внутри-кластерная корреляция присутствует, я советую использовать кластерную устойчивую стандартную ошибку, поскольку смещение в вашей SE может быть серьезным (гораздо более проблематичным, чем для гетероскедастичности, см.Angrist & Pischke Глава III.8 для обсуждения этой темы. Но вам нужно достаточно кластера (Ангрист и Пишке говорят 40-50 в роли большого пальца). Скорректированная на кластеры стандартная ошибка учитывает стандартную ошибку, но оставляет ваши точечные оценки без изменений (стандартная ошибка обычно возрастает)!

Оценка с фиксированными эффектами учитывает ненаблюдаемую постоянную во времени неоднородность (как вы упомянули). Это может быть хорошо или плохо: с одной стороны, вам нужно меньше предположений, чтобы получить согласованные оценки. С другой стороны, вы отбрасываете много различий, которые могут быть полезны. Некоторые люди, такие как Эндрю Гельман, предпочитают иерархическое моделирование фиксированным эффектам, но здесь мнения расходятся. Оценка с фиксированными эффектами изменит как точечные, так и интервальные оценки (также здесь стандартная ошибка обычно будет выше).

Итак, подведем итог: устойчивая к кластерам стандартная ошибка - это простой способ объяснить возможные проблемы, связанные с кластеризованными данными, если вы не хотите заниматься моделированием меж- и внутрикластерной корреляции (а кластеров достаточно). Оценка с фиксированными эффектами будет использовать только определенные вариации, поэтому зависит от вашей модели, хотите ли вы сделать оценки на основе меньших вариаций или нет. Но без дополнительных предположений оценка с фиксированными эффектами не решит проблемы, связанные с внутрикластерной корреляцией для матрицы отклонений. Ни одна кластерно-устойчивая стандартная ошибка не будет учитывать проблемы, связанные с использованием оценки с фиксированными эффектами.

— Арне Йонас Варнке
источник

2

Хороший ответ. Ключевой оставшийся вопрос заключается в том, почему кто-то хочет ОБА. Имбенс и Вулдридж до некоторой степени покрывают это.

— QuestionAnswer

13

Фиксированные эффекты предназначены для устранения ненаблюдаемой неоднородности между различными группами в ваших данных.

Я не согласен с подразумеваемым в принятом ответе, что решение использовать модель FE будет зависеть от того, хотите ли вы использовать «меньше вариаций или нет». Если на вашу зависимую переменную влияют ненаблюдаемые переменные, которые систематически различаются по группам на вашей панели, то коэффициент для любой переменной, которая коррелирует с этим изменением, будет смещен. Если ваши X-переменные не были назначены случайным образом (и они никогда не будут с данными наблюдений), обычно довольно легко сделать аргумент для смещения пропущенных переменных. Вы можетебыть в состоянии контролировать некоторые из пропущенных переменных с хорошим списком контрольных переменных, но если ваша цель номер 1 - надежная идентификация, даже обширный список элементов управления может оставить критичным читателям возможность усомниться в ваших результатах. В этих случаях обычно рекомендуется использовать модель с фиксированными эффектами.

Стандартные кластерные ошибки предназначены для учета ситуаций, когда наблюдения внутри каждой группы не идентифицированы (независимо и идентично распределены).

Классический пример - если у вас много наблюдений за группой фирм во времени. Вы можете учесть фиксированные эффекты на уровне фирмы, но все же могут быть некоторые необъяснимые изменения в вашей зависимой переменной, которые коррелируют во времени. В целом, при работе с данными временных рядов обычно безопасно предполагать временную последовательную корреляцию в терминах ошибок в ваших группах. Эти ситуации являются наиболее очевидными вариантами использования для кластерных SE.

Несколько иллюстративных примеров:

Если у вас есть экспериментальные данные, в которых вы назначаете лечение случайным образом, но проводите повторные наблюдения для каждого отдельного человека / группы с течением времени, вам будет оправдано исключение фиксированных эффектов, но вы захотите объединить свои SE.

В качестве альтернативы, если у вас есть много наблюдений на группу для не экспериментальных данных, но каждое внутригрупповое наблюдение может рассматриваться как извлечение данных из их большей группы (например, у вас есть наблюдения из многих школ, но каждая группа представляет собой случайное подмножество) учащихся из их школы), вы хотели бы включить фиксированные эффекты, но не нуждались бы в кластерных SE.

— Алекс П. Миллер
источник

2

Эти ответы хороши, но самый последний и лучший ответ предоставлен Abadie et al. (2019) «Когда следует настраивать стандартные ошибки для кластеризации?» С фиксированными эффектами основная причина кластеризации - неоднородность эффектов лечения по кластерам. Существуют и другие причины, например, если кластеры (например, фирмы, страны) являются подмножеством кластеров в популяции (о которых вы делаете вывод). Кластеризация - это вопрос дизайна, главное сообщение статьи. Не делай это вслепую.

— Кишоре Гаванде
источник