Из того, что я могу сказать, между AIC и BIC нет большой разницы. Оба они представляют собой математически удобные приближения, которые можно сделать для эффективного сравнения моделей. Если они дают вам разные «лучшие» модели, это, вероятно, означает, что у вас высокая неопределенность модели, о которой стоит беспокоиться больше, чем о том, следует ли вам использовать AIC или BIC. Мне лично больше нравится BIC, потому что он спрашивает больше (меньше) модели, есть ли у нее больше (меньше) данных, чтобы соответствовать ее параметрам - вроде как учитель просит более высокий (более низкий) стандарт успеваемости, если у его ученика больше (меньше) ) время, чтобы узнать о предмете. Мне это кажется интуитивно понятным. Но тогда я уверен, что существуют также одинаково интуитивные и убедительные аргументы для AIC, учитывая его простую форму.
Теперь всякий раз, когда вы делаете приближение, наверняка будут некоторые условия, когда эти приближения являются мусором. Это, безусловно, можно увидеть для AIC, где существует множество «корректировок» (AICc) для учета определенных условий, которые делают исходное приближение плохим. Это также присутствует для BIC, потому что существуют различные другие более точные (но все еще эффективные) методы, такие как полные аппроксимации Лапласа к смесям g-априоров Зеллера (BIC является приближением к методу аппроксимации Лапласа для интегралов).
Одно из мест, где они оба дерьмовы, - это когда у вас есть существенная предварительная информация о параметрах в любой данной модели. AIC и BIC излишне наказывают модели, в которых параметры частично известны, по сравнению с моделями, которые требуют, чтобы параметры оценивались по данным.
P(D|M,A)P(M|D,A)MMA
Mi:the ith model is the best description of the dataA:out of the set of K models being considered, one of them is the best
А затем продолжайте назначать те же вероятностные модели (те же параметры, те же данные, те же приближения и т. Д.), Я получу тот же набор значений BIC. Только придавая какое-то уникальное значение логической букве «М», можно втянуть себя в неуместные вопросы об «истинной модели» (отголоски «истинной религии»). Единственное, что «определяет» М - это математические уравнения, которые используют его в своих вычислениях - и это едва ли когда-либо выделяет одно-единственное определение. Я мог бы в равной степени вставить предложение о прогнозе относительно M («i-я модель даст лучшие прогнозы»). Я лично не понимаю, как это изменит любую из вероятностей, и, следовательно, насколько хорошим или плохим будет BIC (AIC в этом отношении также - хотя AIC основан на другом происхождении)
И , кроме того, что случилось с утверждением Если истинная модель в наборе я рассматриваю, то есть 57% вероятность того , что модель B . Мне кажется это достаточно разумным, или вы могли бы выбрать более «мягкую» версию, с 57% вероятностью, что модель B является лучшей из рассматриваемого набора
Последний комментарий: я думаю, что вы найдете столько же мнений об AIC / BIC, сколько людей о них знают.