На стр. 34 из его PRNN Брайан Рипли комментирует, что «АИК был назван Акаике (1974) как« Информационный критерий », хотя, как представляется, принято считать, что А означает Акаике». Действительно, при введении статистики AIC Akaike (1974, с.719) объясняет, что
"IC stands for information criterion and A is added so that similar statistics, BIC, DIC
etc may follow".
Рассматривая эту цитату как прогноз, сделанный в 1974 году, интересно отметить, что всего за четыре года Akaike (1977, 1978) и Schwarz (1978) предложили два типа статистики BIC (байесовская IC). Это заняло Spiegelhalter et al. (2002) гораздо дольше придумывать DIC (Deviance IC). Хотя появление критерия CIC не было предсказано Akaike (1974), было бы наивно полагать, что оно никогда не рассматривалось. Он был предложен Карлосом К. Родригесом в 2005 году. (Обратите внимание, что CIC Р. Тибширани и CIC (инфляция-критерий ковариантности) - это другое.)
Я знал, что EIC (Эмпирический IC) был предложен людьми Университета Монаш примерно в 2003 году. Я только что обнаружил Критерий Сфокусированной Информации (FIC). В некоторых книгах Hannan и Quinn IC называются HIC, см., Например, эту ). Я знаю, что должен быть GIC (Generalized IC), и я только что обнаружил критерий инвестирования в информацию (IIC). Есть NIC, TIC и многое другое.
Я думаю, что я мог бы охватить остальную часть алфавита, поэтому я не спрашиваю, где последовательность AIC, BIC, CIC, DIC, EIC, FIC, GIC, HIC, IIC, ... остановок, или какие буквы алфавита имеют не использовался или использовался, по крайней мере, дважды (например, E в EIC может означать расширенный или эмпирический). Мой вопрос проще, и я надеюсь, что более практичным. Могу ли я использовать эту статистику взаимозаменяемо, игнорируя конкретные предположения, в которых они были получены, конкретные ситуации, в которых они должны были применяться, и т. Д.?
Этот вопрос частично мотивирован Burnham & Anderson (2001), который пишет:
...the comparison of AIC and BIC model selection ought to be based on their performance
properties such as mean square error for parameter estimation (includes prediction) and
confidence interval coverage: tapering effects or not, goodness-of-fit issues,
derivation of theory is irrelevant as it can be frequentist or Bayes.
Глава 7 монографии Хиндмана и др. По экспоненциальному сглаживанию, похоже, следует совету БА при рассмотрении того, насколько хорошо работают пять альтернативных интегральных схем (AIC, BIC, AICc, HQIC, LEIC) при выборе модели, которая лучше всего прогнозирует (как измерено). вновь предложенной мерой ошибки, названной MASE), чтобы сделать вывод, что AIC чаще была лучшей альтернативой. (HQIC был назван лучшим селектором модели только один раз.)
Я не уверен, какова полезная цель исследовательских упражнений, которые неявно обрабатывают все ICc, как если бы они были получены, чтобы ответить на один и тот же вопрос при эквивалентных наборах предположений. В частности, я не уверен, насколько полезно исследовать прогностическую эффективность непротиворечивого критерия для определения порядка авторегрессии (которую Ханнан и Куинн вывели для эргодических стационарных последовательностей), используя его в контексте нестационарной экспоненциальной модели сглаживания, описанные и проанализированные в монографии Hyndman et al. Я что-то здесь упускаю?
Рекомендации:
Akaike, H. (1974), Новый взгляд на идентификацию статистической модели, IEEE Транзакции по автоматическому управлению 19 (6), 716-723.
Akaike, H. (1977), О принципе максимизации энтропии, в PR Кришнаи, изд., Приложения статистики , Vol. 27, Амстердам: Северная Голландия, с. 27-41.
Akaike, H. (1978), Байесовский анализ процедуры минимальной AIC, Летопись Института статистической математики 30 (1), 9-14.
Burnham, KP & Anderson, DR (2001) Информация Кульбака-Лейблера как основа для сильного вывода в экологических исследованиях, Wildlife Research 28, 111-119
Хиндман Р.Дж., Келер А.Б., Орд, Дж.К. и Снайдер Р.Д. Прогнозирование с экспоненциальным сглаживанием: подход в пространстве состояний. Нью-Йорк: Спрингер, 2008
Рипли Б. Д. Распознавание образов и нейронные сети . Кембридж: издательство Кембриджского университета, 1996
Schwarz, G. (1978), Оценка размерности модели, Annals of Statistics 6 (2), 461-464.
Spiegelhalter, DJ, Best, NG, Carlin, BP и van der Linde, A. (2002), Байесовские меры сложности модели и т (с обсуждением), Журнал Королевского статистического общества. Серия B (Статистическая методология) 64 (4), 583-639.