Какая разница инфляции фактор я должен использовать:


30

Я пытаюсь интерпретировать дисперсии коэффициентов инфляции с использованием vifфункции в пакете R car. Функция печатает как обобщенный и . Согласно файлу справки , это последнее значениеVIFGVIF1/(2df)

Чтобы настроить размер доверительного эллипсоида, функция также печатает GVIF ^ [1 / (2 * df)], где df - степени свободы, связанные с термином.

Я не понимаю смысла этого объяснения в файле справки, поэтому я не уверен, должен ли я использовать или . Для моей модели эти два значения очень разные (максимальное значение равно ~ ; максимальное значение равно ~ ).GVIFGVIF1/(2df)GVIF60GVIF1/(2df)3

Может ли кто-нибудь объяснить мне, какой из них мне следует использовать, и что подразумевается под настройкой размера доверительного эллипсоида?

Ответы:


25

Жорж Монетт и я представили GVIF в статье «Общая диагностика коллинеарности», JASA 87: 178-183, 1992 ( ссылка ). Как мы объяснили, GVIF представляет собой квадратичное отношение гиперобъемов эллипсоида доверительной вероятности для подмножества коэффициентов к «утопическому» эллипсоиду, который был бы получен, если бы регрессоры в этом подмножестве не коррелировали с регрессорами в дополнительном подмножестве. В случае одного коэффициента, это специализируется на обычном VIF. Чтобы сделать GVIF сопоставимыми по измерениям, мы предложили использовать GVIF ^ (1 / (2 * Df)), где Df - число коэффициентов в подмножестве. Фактически это уменьшает GVIF до линейной меры, а для VIF, где Df = 1, пропорционально инфляции из-за коллинеарности в доверительном интервале для коэффициента.


3
Добро пожаловать на наш сайт! Мы будем рады, если вы зарегистрируете свой аккаунт и заходите время от времени. Одно небольшое служебное замечание: вам не нужно подписывать свои посты, ваш идентификатор со ссылкой на вашу страницу автоматически добавляется к каждому вашему ответу.
gung - Восстановить Монику

24

Я столкнулся с точно таким же вопросом и попытался проработать свой путь. Смотрите мой подробный ответ ниже.

Прежде всего, я нашел 4 варианта, которые дают похожие значения VIF в R:

corvifкоманда из пакета AED,

vifкоманда из пакета автомобилей,

vifкоманда из пакета rms,

vifкоманда из пакета DAAG.

Использование этих команд на наборе предикторов, не включающем какие-либо факторы / категориальные переменные или полиномиальные термины, является прямым шагом вперед. Все три команды выдают одинаковый числовой вывод, хотя corvifкоманда из пакета AED помечает результаты как GVIF.

Однако, как правило, GVIF вступает в игру только для факторов и полиномиальных переменных. Переменные, которые требуют более 1 коэффициента и, следовательно, более 1 степени свободы, обычно оцениваются с использованием GVIF. Для однофакторных членов VIF равен GVIF.

Таким образом, вы можете применять стандартные эмпирические правила о том, может ли быть коллинеарность, например пороговое значение 3, 5 или 10. Тем не менее, некоторая осторожность может (должна) быть применена (см .: http://www.nkd-group.com/ghdash/mba555/PDF/VIF%20article.pdf ).

В случае многофакторных терминов, например, для категориальных предикторов, 4 пакета выдают разные результаты. vif команды из среднеквадратичных и пакетов Daag производят значения VIF, в то время как две других значений производят GVIF.

Давайте сначала посмотрим на значения VIF из пакетов rms и DAAG:

TNAP     ICE     RegB    RegC    RegD    RegE

1.994    2.195   3.074   3.435   2.907   2.680

TNAP и ICE являются непрерывными предикторами, а Reg является категориальной переменной, представленной фиктивными переменными RegB-RegE. В этом случае RegA является базовой линией. Все значения VIF довольно умеренные и обычно не о чем беспокоиться. Проблема с этим результатом заключается в том, что на него влияет базовая линия категориальной переменной. Чтобы быть уверенным в том, что значение VIF не превышает допустимый уровень, необходимо повторить этот анализ для каждого уровня категориальной переменной, являющейся базовой линией. В этом случае пять раз.

Применяя corvifкоманду из пакета AED или vifкоманду из автомобильного пакета, создаются значения GVIF:

     |  GVIF     | Df | GVIF^(1/2Df) |  

TNAP | 1.993964  | 1  | 1.412078     |
ICE  | 2.195035  | 1  | 1.481565     | 
Reg  | 55.511089 | 5  | 1.494301     |

GVIF рассчитывается для наборов связанных регрессоров, таких как набор фиктивных регрессоров. Для двух непрерывных переменных TNAP и ICE это то же самое, что и значения VIF ранее. Для категориальной переменной Reg мы теперь получаем одно очень высокое значение GVIF, даже если все значения VIF для отдельных уровней категориальной переменной были умеренными (как показано выше).

гВяF(1/(2×Dе))гВяF(1/(2×Dе))Значение категориальной переменной является аналогичной мерой для снижения точности оценки коэффициентов из-за коллинеарности (даже если она не готова к цитированию, также посмотрите http://socserv2.socsci.mcmaster.ca/jfox/papers/linear- модели-проблемы.pdf ).

гВяF(1/(2×Dе))GVIF(1/(2×Df))

GVIF(1/(2×Df))GVIF(1/(2×Df))GVIF2(1/(2×Df))<2


Добро пожаловать на сайт, @JanPhilippS. Это кажется таким же новым вопросом, как ответ на вопрос ОП. Пожалуйста, используйте только поле «Ваш ответ», чтобы предоставить ответы. Если у вас есть свой вопрос, нажмите [ASK QUESTION]вверху и задайте его там, тогда мы можем помочь вам должным образом. Поскольку вы новичок здесь, вы можете принять участие в нашем туре , который содержит информацию для новых пользователей.
gung - Восстановить Монику

2
Ну, это не совсем новый вопрос. Скорее подробный ответ.
Jan Philipp S

1
@JanPhilippS, спасибо за ссылки на источники для дальнейшего чтения. Я думаю, что ваш пост показался мне качественным ответом, который позволил подумать о состоянии дел.
timothy.s.lau

6

Fox & Monette (оригинальная цитата для GVIF, GVIF ^ 1 / 2df) предлагает принять GVIF до степени 1 / 2df, что делает значение GVIF сопоставимым по разному количеству параметров. «Это аналогично получению квадратного корня от обычного фактора дисперсии-инфляции» (от An R и S-Plus Companion до Прикладной регрессии Джона Фокса). Так что да, возведение в квадрат и применение обычного эмпирического правила VIF кажется разумным.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.