AIC = -2Ln (L) + 2k
где L - максимальное значение функции правдоподобия для этой модели, а k - количество параметров в модели.
В вашем примере -2Ln (L) + 2k <0 означает, что логарифмическая вероятность на максимуме была> 0, что означает, что вероятность на максимуме была> 1.
Нет проблем с положительным логарифмическим правдоподобием. Это распространенное заблуждение, что логарифмическая вероятность должна быть отрицательной. Если вероятность получается из плотности вероятности, она вполне может превышать 1, что означает, что логарифмическая вероятность положительна, следовательно, отклонение и AIC отрицательны. Это то, что произошло в вашей модели.
Если вы считаете, что сравнение AIC является хорошим способом выбора модели, тогда все равно будет иметь место (алгебраически) более низкая AIC, а не та, с наименьшим абсолютным значением AIC. Чтобы повторить, вы хотите наиболее отрицательное число в вашем примере.