Как сохранить переменные, не зависящие от времени, в модели с фиксированными эффектами


15

У меня есть данные о сотрудниках крупной итальянской фирмы за десять лет, и я хотел бы увидеть, как гендерный разрыв в заработках мужчин и женщин менялся с течением времени. Для этого я запускаю объединенные OLS: где - это логарифм за год, X_ {это} включает ковариаты, которые различаются по индивидам и времени, d_t - это манекены за год, а {\ rm male} _i равно единице, если работник - мужчина, и равен нулю в противном случае.

yit=Xitβ+δmalei+t=110γtdt+εit
yXitdtmalei

Теперь я обеспокоен тем, что некоторые ковариаты могут быть соотнесены с ненаблюдаемыми фиксированными эффектами. Но когда я использую оценку фиксированных эффектов (в пределах) или первые различия, я теряю пустышку, потому что эта переменная не меняется со временем. Я не хочу использовать оценщик случайных эффектов, потому что я часто слышу, как люди говорят, что он делает предположения, которые очень нереалистичны и вряд ли подойдут.

Есть ли какие-либо способы для того, чтобы сохранять гендерные манекены и контролировать фиксированные эффекты одновременно? Если есть способ, нужно ли кластеризовать или позаботиться о других проблемах с ошибками для проверки гипотез по переменной пола?

Ответы:


22

Есть несколько возможных способов сохранить пустышку с фиксированной регрессией эффектов.

В Estimator
Предположим, у вас есть аналогичная модель по сравнению с вашей объединенной моделью OLS: где переменные такие же, как и раньше. Теперь обратите внимание, что и не могут быть идентифицированы, поскольку оценщик не может отличить их от фиксированного эффекта . Учитывая, что - это перехват для базового года , - это влияние пола на заработок в этот период. В этом случае мы можем идентифицировать β 1 β 1

yit=β1+t=210βtdt+γ1(malei)+t=110γt(dtmalei)+Xitθ+ci+ϵit
β1c i β 1 t = 1 γβ1+γ1(мaLея)сяβ1Tзнак равно1γ 2 , . , , , Т 10 & gamma ; 2 , . , , , γ 10γ1γ2,,,,,γ10потому что они взаимодействуют с вашими манекенами и измеряют различия в частичных эффектах вашей гендерной переменной по сравнению с первым периодом времени. Это означает, что если вы заметите увеличение ваших течением времени, это будет показателем увеличения разрыва в заработках между мужчинами и женщинами.γ2,,,,,γ10

Оценщик первой разницы
Если вы хотите узнать общее влияние разницы между мужчинами и женщинами во времени, вы можете попробовать следующую модель: где переменная взаимодействует с не от времени полом манекен. Теперь, если вы возьмете первые различия и и вы получите Тогда т = 1 , 2 , . , , , 10 β 1 ( т - 1 ) = 10

YяTзнак равноβ1+ΣTзнак равно210βTdT+γ(Tmalei)+Xitθ+ci+ϵit
Tзнак равно1,2,,,,,10β1y i t - y iся γ(tmal e i -[(t-1
yityi(t1)=t=310βt(dtd(t1))+γ(tmalei[(t1)malei])+(XitXi(t1))θ+ϵitϵi(t1)
γ(tmalei[(t1)malei])=γ[(t(t1))maLея]знак равноγ(мaLея)и вы можете определить гендерную разницу в заработке . Таким образом, окончательное уравнение регрессии будет иметь вид: и вы получите эффект интереса. Приятно то, что это легко реализуется в любом статистическом программном обеспечении, но вы теряете период времени.Δ y i t = 10 t = 3 β t Δ d t + γ ( m a l e i ) + Δ X i t θ + Δ ϵ i tγ
ΔYяTзнак равноΣTзнак равно310βTΔdT+γ(мaLея)+ΔИксяT'θ+ΔεяT

Оценщик Хаусмана-Тейлора В
этом оценщике проводится различие между регрессорами, которые можно предположить как некоррелированные с фиксированным эффектом и теми, которые потенциально связаны с ним. Далее проводится различие между переменными во времени и переменными, не зависящими от времени. Пусть обозначает переменные, которые не связаны с а те, которые являются, и, скажем, ваша гендерная переменная является единственной переменной, не от времени. Затем оценщик Хаусмана-Тейлора применяет преобразование случайных эффектов: где обозначение тильды означается1ся2

Y~яTзнак равноИкс~1яT'+Икс~2яT'+γ(мaLе~я2)+с~я+ε~яT
Икс~1яTзнак равноИкс1яT-θ^яИкс¯1я где используется для преобразования случайных эффектов, а - среднее время по каждому человеку. Это не похоже на обычный оценщик случайных эффектов, которого вы хотели избежать, потому что переменные группы используются для удаления корреляции с . Для инструмент . То же самое делается для переменных, не зависящих от времени, поэтому, если вы укажете переменную пола, которая будет потенциально коррелировать с фиксированным эффектом, она будет оснащенаθ^яX¯1i2ciX~2itX2itX¯2iX¯1i, поэтому у вас должно быть больше не зависящих от времени переменных.

Все это может показаться немного сложным, но для этой оценки есть готовые пакеты. Например, в Stata соответствующая команда xthtaylor. Для получения дополнительной информации об этом методе вы можете прочитать Кэмерон и Триведи (2009) "Микроэконометрика с использованием Stata". В противном случае вы можете просто придерживаться двух предыдущих методов, которые немного проще.

Вывод
Для проверки вашей гипотезы не так много нужно рассматривать, кроме того, что вы должны были бы сделать в любом случае при регрессии с фиксированными эффектами. Вам необходимо позаботиться об автокорреляции в ошибках, например, кластеризовав индивидуальную переменную ID. Это учитывает произвольную структуру корреляции среди кластеров (людей), которая имеет дело с автокорреляцией. Для справки см. Снова Кэмерон и Триведи (2009).


4

Еще один потенциальный способ сохранить пустышку - это подход Мундлака (Mundlak, 1978) для модели с фиксированным эффектом с переменными, не зависящими от времени. Подход Мундлака предполагает, что гендерный эффект может быть спроецирован на групповые средние переменных времени.

Мундлак, Y. 1978: О объединении временных рядов и данных сечений. Эконометрика 46: 69-85.


2

Другой метод заключается в оценке постоянных во времени коэффициентов в уравнении второго этапа с использованием средней ошибки в качестве зависимой переменной.

Сначала оценим модель с помощью FE. Отсюда вы получите оценку и . Для простоты давайте забудем о эффектах года. Определите ошибку оценки как и раньше:βγTU^яT

U^яTYяT-ИксяTβ^

Линейный предиктор :U¯я

U¯яΣTзнак равно1TU^яTзнак равноYяT¯-Икс¯яβ^

Теперь рассмотрим следующее уравнение второго этапа:

U¯язнак равноδмaLея+ся

Предполагая, что пол не связан с ненаблюдаемыми факторами . Тогда оценка OLS для является беспристрастной и согласованной по времени (то есть она согласована, когда ).сяδT


Чтобы доказать вышеизложенное, замените исходную модель на оценщик :U¯я

U¯язнак равноИкс¯яβ-Икс¯яβ^+δмaLея+ся+ΣTзнак равно1TεяTT

Ожидание этой оценки:

Е(U¯я)знак равноИкс¯яβ-Икс¯яЕ(β^)+δмaLея+Е(ся)+ΣTзнак равно1TE(ϵit)T

Если предположения о согласованности FE верны, является объективной оценкой , а . Таким образом:β^βE(ϵit)=0

Е(U¯я)знак равноδмaLея+Е(ся)

Таким образом, наш предиктор является объективной оценкой не зависящих от времени компонентов модели.

Что касается согласованности, предел вероятности этого предиктора составляет:

пИтTU¯язнак равнопИтT(Икс¯яβ)-пИтT(Икс¯яβ^)+пИтTδмaLея+пИтTся+пИтT(ΣTзнак равно1TεяTT)

Опять же, учитывая допущения FE, является непротиворечивой оценкой , и термин ошибки сходится к его среднему значению, которое равно нулю. Следовательно:β^β

пИтTU¯язнак равноδмaLея+ся

Опять же, наш предиктор является последовательной оценкой не зависящих от времени компонентов модели.


1

Устройство камергера Mundlak - идеальный инструмент для этого. Обычно ее называют коррелированной моделью случайных эффектов, поскольку она использует модель случайных эффектов для неявной оценки фиксированных эффектов для переменных во времени, а также для оценки случайных эффектов для переменных, не зависящих от времени.

Тем не менее, в статистических программах вы реализуете их аналогично модели случайных эффектов, но вам необходимо добавить средства для всех вариационных вариантов времени.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.