Данные, которые мы хотим использовать в качестве зависимой переменной, выглядят следующим образом (это данные подсчета). Мы опасаемся, что, поскольку он имеет циклический компонент и структуру тренда, регрессия оказывается как-то предвзятой.
Мы будем использовать отрицательную биномиальную регрессию, если это поможет. Данные представляют собой сбалансированную панель, один манекен на человека (штаты). Показанное изображение отображает сумму зависимой переменной для всех состояний, но большинство состояний в одиночку ведут себя аналогично. Мы рассматриваем модель с фиксированными эффектами. Зависимые переменные не очень сильно коррелированы, часть исследования заключается в том, чтобы найти неожиданную связь между этими переменными, поэтому слабая связь на самом деле является чем-то хорошим.
- Каковы точные опасности не включать переменную запаздывания зависимой переменной?
- Если необходимо включить один, есть ли тест, чтобы узнать, какие из них?
Реализация делается в R.
Примечание : я прочитал этот пост, но он не помог нашей проблеме.