Какова математическая разница между случайными и фиксированными эффектами?


26

Я нашел много в интернете относительно интерпретации случайных и фиксированных эффектов. Однако я не мог получить источник, фиксирующий следующее:

Какова математическая разница между случайными и фиксированными эффектами?

Под этим я подразумеваю математическую формулировку модели и способ оценки параметров.


1
Ну, фиксированные эффекты влияют на среднее распределение, а случайные эффекты влияют на дисперсию и структуру ассоциации. Что именно вы подразумеваете под «математической разницей»? Вы спрашиваете, как изменяется вероятность? Можете быть более конкретными?
Макрос



1
Вопрос, похоже, не отличает фон, из которого он рисуется. Эта терминология в Panel Data Economics отличается от таковой в других социальных науках, использующих многоуровневые модели. Вопрос требует дальнейшего уточнения. Иначе, это вводит в заблуждение тех, кто прибывает сюда с любого происхождения, не зная, что в соответствующей области есть альтернативное определение.
Лучоначо

Ответы:


21

Простейшей моделью со случайными эффектами является односторонняя модель ANOVA со случайными эффектами, заданная наблюдениями с предположениями о распределении: ( y i jμ i ) iid N ( μ i , σ 2 w ) ,YяJ

(YяJ|μя)~н.о.р.N(μя,σвес2),Jзнак равно1,...,J,μя~н.о.р.N(μ,σб2),язнак равно1,...,я,

Здесь случайными эффектами являются . Они являются случайными переменными, тогда как они являются фиксированными числами в модели ANOVA с фиксированными эффектами.μя

Например, каждый из трех техников в лаборатории записывает серию измерений, а y i j - j-е измерение техника i . Назовите μ i «истинным средним значением» ряда, сгенерированного техником i ; это немного искусственный параметр, вы можете увидеть μ я как среднее значение, техник я был бы получен , если он / она записала огромную серию измерений.язнак равно1,2,3YяJJяμяяμяя

Если вы заинтересованы в оценке , μ 2 , μ 3 (например, для оценки смещения между операторами), то вы должны использовать модель ANOVA с фиксированными эффектами.μ1μ2μ3

Вы должны использовать модель ANOVA со случайными эффектами, когда вас интересуют дисперсии и σ 2 b, определяющие модель, и общую дисперсию σ 2 b + σ 2 w (см. Ниже). Дисперсия σ 2 ш представляет собой дисперсию записей , полученных с помощью одного техника (предполагается , чтобы быть одинаковым для всех техников), а σ 2 Ь называется дисперсией между-техническим персоналом . Может быть, в идеале, техников следует выбирать наугад.σвес2σб2 σб2+σвес2σвес2σб2

Эта модель отражает декомпозицию формулы дисперсии для выборки данных: введите описание изображения здесь

Общая дисперсия = дисперсия средних средние вариации+

что отражается моделью ANOVA со случайными эффектами: введите описание изображения здесь

Действительно, распределение определяется его условным распределением ( y i j ), заданным для µ i, и распределением µ i . Если вычислить «безусловное» распределение y i j, то мы найдем y i jN ( µ , σ 2 b + σ 2 w ) .YяJ(YяJ)μяμяYяJYяJ~N(μ,σб2+σвес2)

Смотрите слайд 24 и слайд 25 здесь для лучшего изображения (вы должны сохранить файл PDF, чтобы оценить оверлеи, не смотрите онлайн-версию).


1
(+1) Очень хорошие цифры!
говорит амеба, восстанови Монику

1
Спасибо @amoeba, мой код для моментов инерции доступен в моем блоге: stla.github.io/stlapblog/posts/Variance_inertia.html
Стефан Лоран,

μσ

σ

σσμяσб2μяσвес2

16

По сути, я думаю, что наиболее явным отличием, если вы моделируете фактор как случайный, является то, что предполагается, что эффекты получены из общего нормального распределения.

Например, если у вас есть какая-то модель оценки классов, и вы хотите учесть данные ваших учеников, поступающие из разных школ, и вы моделируете школу как случайный фактор, это означает, что вы предполагаете, что средние значения по школам обычно распределены. Это означает, что два источника изменчивости - это моделирование: изменчивость оценок учеников в школе и вариативность между школами.

Это приводит к тому, что называется частичным пулированием . Рассмотрим две крайности:

  1. Школа не оказывает никакого влияния (между школами изменчивость равна нулю). В этом случае линейная модель, которая не учитывает школу, будет оптимальной.
  2. Школьная изменчивость больше, чем школьная изменчивость. Тогда вам нужно работать на уровне школы, а не на уровне учеников (меньше # выборок). Это в основном модель, в которой вы учитываете школу, используя фиксированные эффекты. Это может быть проблематично, если у вас есть несколько образцов в школе.

Оценивая изменчивость на обоих уровнях, смешанная модель делает разумный компромисс между этими двумя подходами. Особенно, если у вас не так много # учеников на школу, это означает, что вы получите сокращение эффектов для отдельных школ, как оценивается моделью 2, к общему среднему значению модели 1.

Это объясняется тем, что в моделях говорится, что если у вас есть одна школа с двумя учащимися, что лучше, чем «нормально» для населения школ, то, вероятно, отчасти это объясняется тем, что школе повезло в выборе из двух студентов посмотрели. Он не делает это вслепую, он делает это в зависимости от оценки внутри школьной изменчивости. Это также означает, что уровни воздействия с меньшим количеством выборок более сильно тянутся к общему среднему значению, чем в крупных школах.

Важно то, что вам нужен обмен на уровнях случайного фактора. В этом случае это означает, что школы (исходя из ваших знаний) являются взаимозаменяемыми, и вы ничего не знаете, что отличает их (кроме какого-то удостоверения личности). Если у вас есть дополнительная информация, вы можете включить ее в качестве дополнительного фактора, достаточно, чтобы школы были взаимозаменяемыми при условии учета другой информации.

Например, имеет смысл предположить, что 30-летние взрослые, проживающие в Нью-Йорке, могут обмениваться при условии наличия пола. Если у вас есть больше информации (возраст, этническая принадлежность, образование), имеет смысл также включить эту информацию.

OTH, если у вас есть исследование с одной контрольной группой и тремя группами дико разных заболеваний, не имеет смысла моделировать группу как случайную, поскольку конкретное заболевание не подлежит обмену. Однако многим людям настолько нравится эффект сжатия, что они все равно будут спорить о модели случайных эффектов, но это уже другая история.

Я заметил, что не слишком разбираюсь в математике, но в основном разница в том, что модель случайных эффектов оценивает нормально распределенную ошибку как на уровне школ, так и на уровне учащихся, в то время как модель с фиксированным эффектом имеет ошибку только на уровень студентов. Особенно это означает, что каждая школа имеет свой собственный уровень, который не связан с другими уровнями общим распределением. Это также означает, что фиксированная модель не позволяет экстраполировать учащегося школы, не включенного в исходные данные, в то время как модель случайного эффекта делает это, с вариативностью, которая является суммой уровня учащегося и изменчивости школьного уровня. Если вы особенно заинтересованы в вероятности, мы могли бы это проработать.


1
(+1) Отличный ответ, который удивительно недооценен. Я заметил сбивающую с толку опечатку: «исключен» должен читать «включен». Кроме того: какова ожидаемая практическая разница между отношением школы к случайному и фиксированному эффекту? Я понимаю, что фиксированное поведение не позволяет прогнозировать успеваемость учащегося из новой школы, но как насчет различий в доступных данных? Допустим, другие фиксированные эффекты - это пол, раса и вес ученика (что угодно). Влияет ли случайное / фиксированное отношение к школе на силу основных эффектов или взаимодействий интересов? Есть другие отличия?
говорит амеба, восстанови Монику

3
@amoeba Оставляя в стороне согласованность, MSE на коэффициент студенческого уровня может быть более или менее эффективным в случайной по сравнению с моделью с фиксированными эффектами, в зависимости, среди прочего, от уровня корреляции между учеником X и случайным эффектом, числами кластеров и т. д. . Кларк и Линцер 2012 имеет моделирование результатов.
conjugateprior

1
@conjugateprior Wow, большое спасибо за этот комментарий! Я прочитал связанную статью, и это самое четкое объяснение проблемы, которую я видел. Я потратил довольно много времени, читая здесь различные темы в резюме о фиксированных / случайных эффектах, но не мог понять, когда следует использовать один поверх другого и почему. Чтение C & L многое мне прояснило. Возможно, вы хотите написать ответ где-нибудь в резюме, представляющий резюме этой и / или связанных с ней работ? Я запускаю награду в потоке с наибольшим количеством голосов [смешанная модель] и буду рад наградить вас еще одной.
говорит амеба, восстанови Монику

@ Эрик, я отредактировал, чтобы исправить «частичное обучение» на «частичное объединение». Я думаю, что это была опечатка, но извинения, если это был намеченный каламбур!
говорит амеба, восстанови Монику

2

В эконо- мике такими эффектами являются индивидуально-специфические перехваты (или константы), которые не соблюдаются, но могут быть оценены с использованием панельных данных (повторное наблюдение на тех же единицах во времени). Метод оценки с фиксированными эффектами учитывает корреляцию между перехватами, специфичными для единицы, и независимыми объяснительными переменными. Случайных эффектов нет. Стоимость использования более гибких фиксированных эффектов заключается в том, что вы не можете оценить коэффициент по переменным, которые не зависят от времени (например, пол, религия или раса).

NB. Другие области имеют свою собственную терминологию, которая может быть довольно запутанной.


(-1) это ничего не говорит о математической разнице между фиксированными и случайными эффектами
Макрос

1
@Macro Согласен. До того, как это произойдет, было бы полезно узнать, является ли экономическая терминология тем, что ищет ОП. Я должен был прояснить это.
Дмитрий Владимирович Мастеров

ХОРОШО. В таком случае это может быть более уместным в качестве комментария, не правда ли?
Макрос

Утверждение «Стоимость использования более гибких фиксированных эффектов заключается в том, что вы не можете оценить коэффициент для переменных, которые не зависят от времени», просто не соответствует действительности. Я только что провел симуляцию, в которой вы повторяли измерения для отдельных лиц и одного бинарного предиктора, который не меняется во времени. Если вы включите фиксированный эффект для идентификатора и один для двоичного предиктора, вы наверняка сможете оценить коэффициент на двоичном предикторе (хотя, я признаю, если у вас не много повторных измерений, оценка действительно имеет большая стандартная ошибка).
Макрос

3
Эндрю Гельман (который не является экономистом) перечисляет 5 различных определений в своей статье ANOVA: stat.columbia.edu/~gelman/research/published/banova7.pdf .
Дмитрий Васильевич Мастеров

2

В стандартном программном пакете (например, R lmer) основное отличие:

  • фиксированные эффекты оцениваются по максимальной вероятности (наименьших квадратов для линейной модели)
  • случайные эффекты оцениваются эмпирическим байесовским методом (метод наименьших квадратов с некоторой усадкой для линейной модели, где параметр усадки выбирается по максимальной вероятности)

Если вы байесовец (например, WinBUGS), то никакой разницы нет.


3
Я категорически не согласен с тем, что нет никакой разницы. Вы могли бы приспособить байесовскую модель с фиксированными эффектами всеми коэффициентами, имеющими отдельные приоры, или байесовскую смешанную модель, где есть гиперпараметры.
Эрик

Если ты байесовский, разница выглядит следующим образом .
сопряженный

@ Симон, это точный и хрустящий ответ. Я должен был упомянуть это давно.
Субхаш С. Давар

-3

@Joke Модель с фиксированными эффектами подразумевает, что размер эффекта, генерируемый исследованием (или экспериментом), является фиксированным, т.е. повторные измерения для вмешательства дают одинаковый размер эффекта. Вероятно, внешние и внутренние условия для эксперимента не изменяются. Если у вас есть несколько испытаний и / или исследований в разных условиях, у вас будут разные эффекты. Параметрические оценки среднего значения и дисперсии для набора размеров эффекта могут быть реализованы, если предположить, что это фиксированные эффекты или случайные эффекты (реализуемые в суперпопуляции). Я думаю, что это вопрос, который можно решить с помощью математической статистики.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.