Когда необходимо включать отставание зависимой переменной в регрессионную модель и какое отставание?


14

Данные, которые мы хотим использовать в качестве зависимой переменной, выглядят следующим образом (это данные подсчета). Мы опасаемся, что, поскольку он имеет циклический компонент и структуру тренда, регрессия оказывается как-то предвзятой.

введите описание изображения здесь

Мы будем использовать отрицательную биномиальную регрессию, если это поможет. Данные представляют собой сбалансированную панель, один манекен на человека (штаты). Показанное изображение отображает сумму зависимой переменной для всех состояний, но большинство состояний в одиночку ведут себя аналогично. Мы рассматриваем модель с фиксированными эффектами. Зависимые переменные не очень сильно коррелированы, часть исследования заключается в том, чтобы найти неожиданную связь между этими переменными, поэтому слабая связь на самом деле является чем-то хорошим.

  1. Каковы точные опасности не включать переменную запаздывания зависимой переменной?
  2. Если необходимо включить один, есть ли тест, чтобы узнать, какие из них?

Реализация делается в R.

Примечание : я прочитал этот пост, но он не помог нашей проблеме.

Ответы:


14

tt1

yit=δyit1+xitβ+μi+vit,

μvδ=0 (вопрос 2).

yit1v . Нам нужно что-то более сложное, чтобы сделать тест.

yy¯iμNNTTδβN=20,100T=5,10,20,30δTT=3020%δ>0yβ

yit2Δyit1=yit1yit2xitxit1Xисходные вместо этого .vy

Arellano и Bond (1991) выводят более эффективный обобщенный метод оценки моментов (GMM), который был расширен с тех пор, ослабив некоторые из предположений. Глава 8 панельной книги Балтаги является хорошим обзором этой литературы, хотя, насколько я могу судить, она не касается выбора лагов. Это современная метрика, но более технически сложная.

Я думаю, что plmпакет в R имеет некоторые из этих встроенных. Динамические модели панелей были в Stata начиная с версии 10 , и SAS имеет версию GMM по крайней мере. Ни одна из этих моделей не является подсчетом данных, но это может не иметь большого значения в зависимости от ваших данных. Тем не менее, вот один пример динамической модели Пуассона GMM в Stata.

yβ


Таким образом, вы используете уровни в качестве инструмента, когда у вас есть разные серии, и различия, когда у вас есть серии по уровням ?
Энди W

iΔyt2=yt2yt3yt2Δyt1=yt1yt2
Дмитрий Васильевич Мастеров
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.