Как сравнить модели на основе AIC?


13

У нас есть две модели, которые используют один и тот же метод для вычисления логарифмической вероятности, и AIC для одной ниже, чем другой. Тем не менее, тот с более низким AIC интерпретировать гораздо сложнее.

У нас возникают проблемы с принятием решения, стоит ли вводить сложность, и мы судили об этом, используя процентную разницу в AIC. Мы обнаружили, что разница между двумя AIC составляла всего 0,7%, а в более сложной модели AIC была на 0,7% ниже.

  1. Является ли низкая процентная разница между двумя причинами, чтобы избежать использования модели с более низким AIC?

  2. Объясняет ли процент разницы, что в менее сложной модели теряется на 0,7% больше информации?

  3. Могут ли две модели иметь очень разные результаты?



2
@ArunJose, это не похоже на дубликат. Вопросы здесь совершенно разные.
Ричард Харди

1
Нет. Этот вопрос не о сопоставимости моделей. Мы уже знаем, что модели сравнимы. Этот вопрос относится к тому, что считается значительным различием в AIC и компромиссе между сложностью и соответствием модели.
Али Тураб Лотия

Ответы:


25

Никто не сравнивает абсолютные значения двух AIC (которые могут быть как но также 1000000 ), но учитывает их разницу : Δ i = A I C i - A I C m i n , где A I C i - это AIC i-й модели, а A I C m i n - самая низкая AIC, полученная среди множества рассмотренных моделей (т. Е. Предпочтительной модели). Практическое правило, изложенное, например, в1001000000

Δi=AICiAICmin,
AICiiAICminBurnham & Anderson 2004 , это:
  1. Δi<2i
  2. 2<Δi<4i
  3. 4<Δi<7i
  4. Δi>10

Теперь, что касается 0,7%, упомянутых в вопросе, рассмотрим две ситуации:

  1. AIC1=AICmin=100AIC2AIC2=100.7Δ2=0.7<2
  2. AIC1=AICmin=100000AIC2AIC2=100700Δ2=70010

Следовательно, утверждение о том, что разница между AIC составляет 0,7%, не дает никакой информации.

LΔiΔi=AICiAICminAICmin:=0

Формулировка AIC предусматривает использование чрезмерного количества параметров, что препятствует переоснащению. Он предпочитает модели с меньшим количеством параметров, если другие не обеспечивают существенно лучшего соответствия. AIC пытается выбрать модель (из рассмотренных), которая наиболее адекватно описывает реальность (в форме исследуемых данных). Это означает, что фактически модель, представляющая собой реальное описание данных, никогда не рассматривается. Обратите внимание, что AIC дает вам информацию, какая модель лучше описывает данные, но не дает никакой интерпретации .

ΔiΔi<2Δi<5

i

pi=exp(Δi2),

AICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin

Наконец, по поводу формулы для AIC:

AIC=2k2L,

LΔi2kΔi2Δk<1

TL; DR

  1. Это плохая причина; используйте разницу между абсолютными значениями AIC.
  2. Процент ничего не говорит.
  3. Невозможно ответить на этот вопрос из-за отсутствия информации о моделях, данных и значении различных результатов .

1
Это самое ясное объяснение, которое я когда-либо видел в этом загадочном деле. Я посмотрел на статью, на которую вы ссылались (стр. 270-272), и ваше объяснение здесь является простым и ясным, но очень точным представлением того, что объясняет статья.
Трипартио

Не могли бы вы помочь с этим вопросом? stats.stackexchange.com/questions/349883/…
Tripartio
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.