vcovHC, vcovHAC, NeweyWest - какую функцию использовать?


10

Я пытаюсь обновить модель на основе lm (), чтобы получить правильные стандартные ошибки и тесты. Я действительно запутался, какую матрицу VC использовать. В sandwichпакет предложений vcovHC, vcovHACи NeweyWest. В то время как первый учитывает только гетероскедастичность, последние два учитывают как последовательную корреляцию, так и гетероскедастичность. Тем не менее, документация мало говорит о разнице между двумя последними (по крайней мере, я не понимаю). Глядя на саму функцию, я понял, что NeweyWest фактически вызывает vcovHAC.

Эмпирически результаты coeftest(mymodel, vcov. = vcovHAC)и coeftest(mymodel, vcov. = NeweyWest)безумны разные. Хотя vcovHACэто несколько близко к наивным результатам lm, при использовании NeweyWest все коэффициенты становятся незначительными (тесты даже близки к 1).


Обычно страницы справки R дают ссылку на статьи. Точные детали обычно находятся там. Например, статья Zeileis находится в свободном доступе и содержит множество информации.
mpiktas

2
В статье Zeileis конкретно указано, чем vcovHACотличается NeweyWest. Подводя итог, можно сказать, что разные методы HAC различаются только по выбору весов. NeweyWestимеет заданные веса, vcovHACэто общая функция, которая позволяет вам указывать ваши собственные веса, и по умолчанию использует веса Эндрюса.
mpiktas

@mpiktas: спасибо за резюме. Поскольку я не указал веса, следует использовать соответствующие веса по умолчанию. Теперь, когда я знаю, мне следует повторить свой вопрос: почему разные веса по умолчанию для vcovHAC и NeweyWest имеют такое большое значение и как определять веса? Я имею в виду, знаете ли вы, какие веса используют STATA или другие пакеты?
hans0l0

Все эти вычисления зависят от того факта, что являются стационарными переменными, где - регрессоры, а - возмущения. Стационарность является немного ограничительным свойством, поэтому проверьте, выполняется ли оно. xtutxtut
mpiktas

Ответы:


3

Рассматриваемый «бутерброд» - это два куска хлеба, определяемые ожидаемой информацией, содержащей мясо, определяемое наблюдаемой информацией. Смотрите мои комментарии здесь и здесь . Для линейной регрессии оценочное уравнение имеет вид:

U(β)=XT(YXTβ)

Ожидаемая информация (хлеб):

A=U(β)β=(XTX)

Наблюдаемая информация (мясо):

B=E(U(β)U(β)T)=XT(YXTβ)(YXTβ)TX

Обратите внимание, что внутренний член является диагональю постоянных невязок, когда соблюдается гомоскедастичность, допущение независимых данных, тогда сэндвич-ковариационная оценка, которая задается как - обычная ковариационная матрица линейной регрессии где - дисперсия невязок. Однако это довольно строго. Вы получаете значительно более широкий класс оценок, ослабляя допущения, связанные с остаточной матрицей : ,A1BA1σ2(XTX)1σ2n×n

R=(YXTβ)(YXTβ)

Оценка "HC0" vcovHCявляется последовательной, даже если данные не являются независимыми. Поэтому я не буду говорить, что мы «предполагаем», что остатки независимы, но я скажу, что мы используем «работающую независимую ковариационную структуру». Тогда матрица заменяется диагональю остатковR

Rii=(YiβXI.)2,0 elsewhere

Эта оценка работает очень хорошо, за исключением небольших выборок (<40 часто подразумевается). HC1-3 - это различные конечные выборочные поправки. HC3, как правило, наиболее эффективен.

Однако, если имеются авторегрессионные эффекты, недиагональные элементы являются ненулевыми, поэтому масштабированная ковариационная матрица создается на основе обычно используемых авторегрессионных структур. Это обоснование для "vcovHAC". Здесь создаются очень гибкие и общие методы для оценки эффекта авторегрессии: детали могут быть за рамками вашего вопроса. Функция «meatHAC» является основной рабочей лошадкой: по умолчанию используется метод Эндрюса. Newey-West является частным случаем общей авторегрессионной оценки ошибок. Эти методы решают одну из двух проблем: 1. с какой скоростью уменьшается корреляция между «соседними» наблюдениями и 2. каково разумное расстояние между двумя наблюдениями? Эти данные Если у вас есть сбалансированные данные панели, эта оценка ковариации является излишней.Tgeegeeпакет вместо того, чтобы указать ковариационную структуру AR-1или аналогичную.

Что касается использования, это зависит от характера анализа данных и научного вопроса. Я бы не советовал подбирать все типы и выбирать тот, который выглядит лучше всего, так как это проблема множественного тестирования. Как я упоминал ранее, оценка vcovHC является последовательной даже при наличии эффекта авторегрессии, поэтому вы можете использовать и обосновать «модель зависимости рабочей независимости» в различных обстоятельствах.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.