Сравнение не вложенных моделей с AIC


19

Скажем, мы должны GLMMs

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

Эти модели не являются вложенными в обычном смысле:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

поэтому мы не можем поступить так, anova(mod1, mod2)как хотели бы anova(a ,b).

Можем ли мы использовать AIC, чтобы сказать, какая модель лучше?

Ответы:


24

AIC может применяться с не вложенными моделями. На самом деле, это один из самых распространенных мифов (недоразумений?) Об АПК. Видеть:

Вы должны быть осторожны, включив все нормализующие константы, поскольку они различны для разных (не вложенных) моделей:

Смотрите также:

В контексте GLMM более деликатный вопрос заключается в том, насколько надежным является AIC для сравнения моделей такого типа (см. Также @ BenBolker's). Другие версии AIC обсуждаются и сравниваются в следующей статье:


2
обратите внимание, что маргинальное и условное различие AIC является наиболее важным при попытке сравнить модели, которые отличаются по своему
набору

@Chandelier & Ben Bolker большое спасибо за оба ваших ответа. У кого-нибудь из вас есть более формальная ссылка на аргумент для использования AIC таким образом?
user1322296

2
@ user1322296 Я бы предложил зайти в корень, это статья Акаике . AIC получается как оценка расхождения между вашей моделью и «истинной моделью». Итак, вложенности не предполагается, только некоторые условия регулярности.
Люстра

Так допустимо ли сравнивать AIC для lm1 = x ~ A + B C и lm2 = x ~ D + B C, например? Спасибо
crazjo

Похоже, существуют не вложенные модели, для которых использование AIC не подходит. Вот два примера: 1 и 2 . Не могли бы вы указать некоторые условия, при которых работает выбор не вложенных моделей?
Карл

10

Для справки: контраргумент: Брайан Рипли утверждает в «Выбор среди больших классов моделей», стр. 6-7.

Основные предположения ... Модели являются вложенными (сноска: см. Нижнюю часть страницы 615 в перепечатке Акаике (1973)). - АПК широко используется, когда они не

Соответствующий отрывок (также стр. 204 другого переиздания Акаике) начинается, как мне кажется, с фразы «Проблема идентификации статистической модели часто формулируется как проблема выбора ) ...») не вполне доступны здесь ; Я ищу PDF документ, чтобы процитировать отрывок здесь ...е(Икс|Кθ

Рипли, BD 2004. «Выбор среди больших классов моделей». В « Методах и моделях в статистике» , под редакцией Н. Адамса, М. Краудера, Д. Дж. Хэнда и Д. Стивенса, 155–70. Лондон, Англия: Imperial College Press.

Akaike, H. (1973) Теория информации и расширение принципа максимального правдоподобия. Во Втором международном симпозиуме по теории информации (ред. Б. Н. Петров и Ф. Каски), с. 267–281, Будапешт. Академия Кайдо. Перепечатано в прорывы в статистике , ред. Kotz, S. & Johnson, NL (1992), том I, стр. 599–624. Нью-Йорк: Спрингер.


3

Похоже, Акаике подумал, что AIC был полезным инструментом для сравнения не вложенных моделей.

«Одно важное замечание об AIC состоит в том, что он определен без конкретной ссылки на истинную модель [f (x | kθ)]. Таким образом, для любого конечного числа параметрических моделей мы всегда можем рассмотреть расширенную модель, которая будет играть роль [f (x | kθ)] Это говорит о том, что AIC может быть полезен, по крайней мере, в принципе, для сравнения моделей, которые не были представлены, т. е. ситуация, когда традиционный тест логарифмического отношения правдоподобия неприменим ».

(Akaike 1985, стр. 399)

Акаике, Хиротугу. «Прогноз и энтропия». Избранные документы Хиротугу Акаике. Springer, New York, NY, 1985. 387-410.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.