Это довольно старый вопрос с некоторыми очень хорошими ответами, однако я думаю, что может быть полезным новый ответ для более прагматичной перспективы.
Когда не следует позволять фиксированному эффекту изменяться в зависимости от уровня случайного эффекта?
Я не буду касаться вопросов, уже описанных в других ответах, вместо этого я буду ссылаться на уже ставшую известной, хотя я бы скорее сказал «печально известную» статью Барра и др. (2013), которую часто называют «Держите ее максимальной».
Barr, DJ, Levy, R., Scheepers, C. and Tily, HJ, 2013. Структура случайных эффектов для проверки подтверждающих гипотез: сохраняйте ее максимальной. Журнал памяти и языка, 68 (3), с.255-278.
В этой статье авторы утверждают, что все фиксированные эффекты должны варьироваться в зависимости от уровней группирующих факторов (случайные перехваты). Их аргумент довольно убедителен - в основном, что, не позволяя им варьироваться, это накладывает ограничения на модель. Это хорошо описано в других ответах. Тем не менее, есть потенциально серьезные проблемы с этим подходом, которые описаны Bates el al (2015):
Бейтс Д., Клигл Р., Васишт С. и Баайен Х., 2015. Экономные смешанные модели. Препринт arXiv arXiv: 1506.04967
Здесь стоит отметить, что Бейтс является основным автором lme4
пакета для подгонки смешанных моделей в R, который, вероятно, является наиболее широко используемым пакетом для таких моделей. Бейтс и др. Отмечают, что во многих реальных приложениях данные просто не поддерживают структуру с максимальными случайными эффектами, часто из-за недостаточного количества наблюдений в каждом кластере для соответствующих переменных. Это может проявиться в моделях, которые не сходятся или являются сингулярными по случайным эффектам. Об этом свидетельствует большое количество вопросов на этом сайте о таких моделях. Они также отмечают, что Барр и др. Использовали относительно простую симуляцию, в которой в качестве основы для их работы использовались случайные эффекты с "хорошим поведением". Вместо этого Бейтс и др. Предлагают следующий подход:
Мы предложили (1) использовать PCA для определения размерности дисперсионно-ковариационной матрицы структуры со случайным эффектом, (2) для первоначального ограничения параметров корреляции до нуля, особенно когда первоначальная попытка подобрать максимальную модель не сходится, и (3) исключить незначительные компоненты дисперсии и связанные с ними параметры корреляции из модели
В той же статье они также отмечают:
Важно отметить, что сближение не происходит из-за дефектов алгоритма оценки, а является прямым следствием попытки подбора модели, которая слишком сложна, чтобы быть должным образом подтвержденной данными.
И:
максимальные модели не нужны для защиты от антиконсервативных выводов. Эта защита полностью обеспечивается комплексными моделями, которые руководствуются реалистическими ожиданиями относительно сложности, которую могут поддерживать данные. В статистике, как и в других областях науки, скупость - это добродетель, а не порок.
Бейтс и др. (2015)
С более прикладной точки зрения, следует дополнительно рассмотреть вопрос о том, должен ли процесс генерирования данных, биологическая / физическая / химическая теория, лежащая в основе данных, направлять аналитика к определению структуры случайных эффектов.