Как (линейные) модели смешанных эффектов обычно сравниваются друг с другом? Я знаю, что могут использоваться тесты отношения правдоподобия, но это не работает, если одна модель не является «подмножеством» другой, верно?
Всегда ли оценка моделей df проста? Количество фиксированных эффектов + количество оцененных компонентов дисперсии? Мы игнорируем оценки случайных эффектов?
Как насчет проверки? Моя первая мысль - перекрестная проверка, но случайные сгибы могут не сработать, учитывая структуру данных. Является ли подходящей методология «опустить один предмет / кластер вне»? А как насчет одного наблюдения?
Мэлловс Cp можно интерпретировать как оценку ошибки прогнозирования моделей. Выбор модели с помощью AIC пытается минимизировать ошибку прогнозирования (поэтому Cp и AIC должны выбрать одну и ту же модель, если я считаю, что ошибки гауссовские). Означает ли это, что AIC или Cp можно использовать для выбора «оптимальной» линейной модели смешанных эффектов из набора некоторых не вложенных моделей с точки зрения ошибки прогнозирования? (при условии, что они соответствуют одним и тем же данным) BIC все еще с большей вероятностью выберет «истинную» модель среди кандидатов?
У меня также сложилось впечатление, что при сравнении моделей со смешанными эффектами через AIC или BIC мы учитываем только фиксированные эффекты в качестве «параметров» в расчете, а не фактические модели df.
Есть ли хорошая литература по этим темам? Стоит ли исследовать cAIC или mAIC? У них есть конкретное применение за пределами AIC?