В чем разница между случайными эффектами, фиксированными эффектами и предельной моделью?


49

Я пытаюсь расширить свои знания в области статистики. Я родом из области физических наук с «основанным на рецептах» подходом к статистическому тестированию, где мы говорим, является ли оно непрерывным, нормально ли оно распределено - регрессия OLS .

В моем чтении я встретил термины: модель случайных эффектов, модель с фиксированными эффектами, маргинальная модель. Мои вопросы:

  • Проще говоря, что они?
  • Каковы различия между ними?
  • Являются ли какие-либо из них синонимами?
  • Где традиционные тесты, такие как регрессия OLS, ANOVA и ANCOVA, попадают в эту классификацию?

Просто пытаюсь решить, куда идти дальше с самообучением.



1
@gung: ответ, за который вы собираетесь присудить награду, на самом деле намного превосходит все ответы в «основной» ветке о различиях между фиксированными / случайными эффектами (ссылка в комментарии выше). Этот вопрос имеет более 40 голосов и получил 25 ответов, что, к сожалению, не очень полезно. Должны ли мы объединить эти темы? Я предполагаю, что это будет означать, что OP N26 потеряет голосование с вопросом, но их учетная запись, похоже, больше не активна. Не уверен, что лучший курс действий.
говорит амеба: восстанови монику

1
Спасибо @amoeba, я думаю, что это тоже заслуживает большего внимания. Мне кажется, что этот вопрос, хотя и называется аналогичным образом, на самом деле немного отличается (и, возможно, неправильно назван). У меня нет полномочий объединять их. Я просто добавил туда комментарий, ссылающийся на эту тему. Почему бы не поднять вопрос о том, что делать с этими темами на meta.CV, и мы увидим, что думают люди?
gung - Восстановить Монику

Ответы:


53

Этот вопрос частично обсуждался на этом сайте, как показано ниже, и мнения кажутся смешанными.

Все термины, как правило, относятся к продольным / групповым / кластеризованным / иерархическим данным и повторным измерениям (в формате расширенной регрессии и ANOVA), но имеют несколько значений в разных контекстах. Я хотел бы ответить на вопрос в формулах, основанных на моих знаниях.

Модель с фиксированными эффектами

  • В биостатистике фиксированные эффекты, обозначенные как в уравнении (*) ниже, обычно сочетаются со случайными эффектами. Но модель с фиксированными эффектами также определена таким образом, чтобы предполагать, что наблюдения независимы, как и установки поперечного сечения, как в Продольном анализе данных Hedeker and Gibbons (2006).β
  • В эконометрике модель с фиксированными эффектами можно записать в виде где - фиксированный (не случайный) перехват для каждого субъекта ( ), или мы также можем иметь фиксированный эффект как для каждого повторного измерения ( ); обозначает ковариаты.
    yij=xijβ+ui+ϵij
    uiiujjxij
  • В метаанализе модель с фиксированным эффектом предполагает, что лежащий в основе эффект одинаков во всех исследованиях (например, Mantel and Haenszel, 1959).

Модель случайных эффектов

  • В биостатистике модель случайных эффектов (Laird and Ware, 1982) можно записать в виде где как предполагается, следует распределению. обозначает ковариаты для фиксированных эффектов, а обозначает ковариаты для случайных эффектов.
    (*)yij=xijβ+zijui+eij
    uixijzij
  • В эконометрике модель случайных эффектов может относиться только к модели случайного перехвата, как в биостатистике, т.е. и - скаляр.zij=1ui
  • В метаанализе модель случайных эффектов предполагает гетерогенные эффекты в разных исследованиях (DerSimonian and Laird, 1986).

Маргинальная модель

Маржинальную модель обычно сравнивают с условной моделью (моделью случайных эффектов), а первая сфокусирована на среднем по совокупности (для примера возьмем линейную модель) тогда как последний имеет дело с условным средним значениемИнтерпретация и масштаб коэффициентов регрессии между маргинальной моделью и моделью случайных эффектов будут отличаться для нелинейных моделей (например, логистическая регрессия). Пусть , тогда

E(yij)=xijβ,
E(yij|ui)=xijβ+zijui.
h(E(yij|ui))=xijβ+zijui
E(yij)=E(E(yij|ui))=E(h1(xijβ+zijui))h1(xijβ),
если тривиальная функция ссылки не является связь идентичности (линейная модель ) или (без случайных эффектов). Хорошие примеры включают обобщенные оценочные уравнения (GEE; Zeger, Liang and Albert, 1988) и маргинальные многоуровневые модели (Heagerty and Zeger, 2000).hui=0

Спасибо, Рандел. Еще один вопрос о терминологии "смешанная модель". Насколько я понимаю, в биостатистике ваше уравнение (*) будет называться смешанной моделью, поскольку оно содержит как случайные, так и фиксированные эффекты. Это правильно? Но используется ли термин «смешанная модель» в эконометрике? Если да, то к чему это относится?
говорит амеба, восстанови Монику

Да, уравнение (*) также называется смешанной моделью в (био) статистике. Насколько я знаю, эконометрист может называть это не «смешанной моделью», а «моделью случайных эффектов» или «моделью случайных коэффициентов», если они заинтересованы в неоднородности кластеров. Для меня единственной разницей является предположение о кластер-специфическом эффекте, фиксированном или случайном.
Рандель

1
@skan обозначает ковариаты для случайных эффектов. Это вектор, а - это транспонирование. zijzij
Рандель

1
Вот подробный пример. Надеюсь, это поможет. @skan
Randel

1
@skan Не рекомендуется иметь оба, достаточно. Вот прекрасный пример.
Randel

1

Поправьте меня, если я здесь не прав:

Концептуально, есть четыре возможных эффекта: фиксированный перехват, фиксированный коэффициент, случайный перехват, случайный коэффициент. Большинство моделей регрессии являются «случайными эффектами», поэтому они имеют случайные перехваты и случайные коэффициенты. Термин «случайный эффект» вошел в употребление в отличие от «фиксированного эффекта».

«Фиксированный эффект» - это когда переменная влияет на часть выборки, но не на все. Простейшей версией модели с фиксированным эффектом (концептуально) будет фиктивная переменная для фиксированного эффекта с двоичным значением. Эти модели имеют один случайный перехват, фиксированные коэффициенты эффекта и случайные переменные коэффициенты.

Следующий уровень сложности (концептуально) - это когда фиксированный эффект не двоичный, а номинальный, со многими значениями. В этом случае генерируется модель с множеством перехватов (по одному для каждого из номинальных значений). Здесь вы получаете классические «множественные линии» модели данных панели , где каждый из «параметров» фиксированной переменной эффекта получает свой собственный эффект. Преимущество объединения всех различных рядов данных, зависящих от факторов, в одну регрессию (вместо того, чтобы делать каждый фактор фиксированного эффекта в качестве своей собственной регрессии) состоит в том, что вы можете объединить дисперсию всех различных эффектов в одном уравнении, и поэтому получить лучшие (более определенные) значения для всех ваших коэффициентов.

«Уровень три» усложнения может возникнуть, когда «фиксированный эффект» сам является случайной величиной, за исключением того, что его эффекты «фиксированы» и влияют только на подмножество выборки. В этот момент модель будет иметь случайный перехват, несколько фиксированных перехватов и несколько случайных переменных. Я думаю, что это то, что известно как модель «смешанных эффектов»?

Модели с «смешанным эффектом» используются для многоуровневого моделирования (MLM), поскольку «фиксированные эффекты» могут использоваться для вложения одного подмножества данных в другое. Эта группировка может иметь несколько уровней, при этом учащиеся размещаются в классах, а в школах. Школа оказывает фиксированное влияние на классные комнаты, а классные комнаты - на учеников. (Школа может или не может иметь фиксированное влияние на ученика, в зависимости от плана эксперимента - не уверен)

Панельные модели данных являются моделями с «смешанным эффектом», но для группировки используются два измерения, обычно время и категория.


Не уверен, что вы подразумеваете под «Фиксированные эффекты охватывают« наборы »вариантов выбора: A или B; ... К случайным эффектам относятся такие вещи, как вес тела». Вы имеете в виду фиксированные эффекты для дискретных переменных, случайные эффекты для непрерывных переменных? Также не уверен, почему «использование нескольких фиктивных переменных для одной и той же вещи статистически неуместно». Модель с фиксированными эффектами в эконометрике имеет фиктивную переменную для каждой «панели». Я не могу согласиться с «смешанными» моделями ... Имея «фиксированные» перехваты путем группировки, у них больше нет случайного перехвата ». Многие модели со смешанными эффектами имеют случайный перехват.
Рандель

Мое понимание несовершенно. Я отредактирую свой ответ и попробую еще раз.
Мокс

Возможно ли, чтобы переменная появлялась одновременно как фиксированный эффект и как случайный эффект?
Скан

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.