По сути, я думаю, что наиболее явным отличием, если вы моделируете фактор как случайный, является то, что предполагается, что эффекты получены из общего нормального распределения.
Например, если у вас есть какая-то модель оценки классов, и вы хотите учесть данные ваших учеников, поступающие из разных школ, и вы моделируете школу как случайный фактор, это означает, что вы предполагаете, что средние значения по школам обычно распределены. Это означает, что два источника изменчивости - это моделирование: изменчивость оценок учеников в школе и вариативность между школами.
Это приводит к тому, что называется частичным пулированием . Рассмотрим две крайности:
- Школа не оказывает никакого влияния (между школами изменчивость равна нулю). В этом случае линейная модель, которая не учитывает школу, будет оптимальной.
- Школьная изменчивость больше, чем школьная изменчивость. Тогда вам нужно работать на уровне школы, а не на уровне учеников (меньше # выборок). Это в основном модель, в которой вы учитываете школу, используя фиксированные эффекты. Это может быть проблематично, если у вас есть несколько образцов в школе.
Оценивая изменчивость на обоих уровнях, смешанная модель делает разумный компромисс между этими двумя подходами. Особенно, если у вас не так много # учеников на школу, это означает, что вы получите сокращение эффектов для отдельных школ, как оценивается моделью 2, к общему среднему значению модели 1.
Это объясняется тем, что в моделях говорится, что если у вас есть одна школа с двумя учащимися, что лучше, чем «нормально» для населения школ, то, вероятно, отчасти это объясняется тем, что школе повезло в выборе из двух студентов посмотрели. Он не делает это вслепую, он делает это в зависимости от оценки внутри школьной изменчивости. Это также означает, что уровни воздействия с меньшим количеством выборок более сильно тянутся к общему среднему значению, чем в крупных школах.
Важно то, что вам нужен обмен на уровнях случайного фактора. В этом случае это означает, что школы (исходя из ваших знаний) являются взаимозаменяемыми, и вы ничего не знаете, что отличает их (кроме какого-то удостоверения личности). Если у вас есть дополнительная информация, вы можете включить ее в качестве дополнительного фактора, достаточно, чтобы школы были взаимозаменяемыми при условии учета другой информации.
Например, имеет смысл предположить, что 30-летние взрослые, проживающие в Нью-Йорке, могут обмениваться при условии наличия пола. Если у вас есть больше информации (возраст, этническая принадлежность, образование), имеет смысл также включить эту информацию.
OTH, если у вас есть исследование с одной контрольной группой и тремя группами дико разных заболеваний, не имеет смысла моделировать группу как случайную, поскольку конкретное заболевание не подлежит обмену. Однако многим людям настолько нравится эффект сжатия, что они все равно будут спорить о модели случайных эффектов, но это уже другая история.
Я заметил, что не слишком разбираюсь в математике, но в основном разница в том, что модель случайных эффектов оценивает нормально распределенную ошибку как на уровне школ, так и на уровне учащихся, в то время как модель с фиксированным эффектом имеет ошибку только на уровень студентов. Особенно это означает, что каждая школа имеет свой собственный уровень, который не связан с другими уровнями общим распределением. Это также означает, что фиксированная модель не позволяет экстраполировать учащегося школы, не включенного в исходные данные, в то время как модель случайного эффекта делает это, с вариативностью, которая является суммой уровня учащегося и изменчивости школьного уровня. Если вы особенно заинтересованы в вероятности, мы могли бы это проработать.