Концепции, лежащие в основе моделей с фиксированными / случайными эффектами


14
  1. Может ли кто-нибудь помочь мне понять модели с фиксированным / случайным эффектом? Вы можете либо объяснить по-своему, если вы переварили эти понятия, либо направить меня к ресурсу (книга, заметки, веб-сайт) с конкретным адресом (номер страницы, глава и т. Д.), Чтобы я мог изучить их без какой-либо путаницы.
  2. Правда ли это: «У нас есть фиксированные эффекты в целом, а случайные эффекты - это особые случаи»? Я был бы особенно благодарен за помощь, когда описание переходит от общих моделей к конкретным с фиксированными и случайными эффектами

2
возможного интереса: stats.stackexchange.com/questions/4700/…
октябрь

См. Ссылки на книги по тегу смешанной модели . Номер 1 рассматривается в (некоторых) вводной главе для всех книг многоуровневого моделирования, которые я прочитал.
Энди Ш

Ответы:


13

Это кажется большим вопросом, поскольку он затрагивает вопрос номенклатуры в эконометрике, который мешает студентам при переходе на статистическую литературу (книги, учителя и т. Д.). Я предлагаю вам http://www.amazon.com/Econometric-Analysis-Cross-Section-Panel/dp/0262232197 глава 10.

Предположим, что интересующая вас переменная наблюдается в двух измерениях (например, отдельные лица и время), зависит от наблюдаемых характеристик и ненаблюдаемых . Если - наблюдаемая заработная плата, то мы можем утверждать, что она определяется наблюдаемыми (образование) и ненаблюдаемыми навыками (таланты и т. Д.). Но ясно, что ненаблюдаемые навыки могут быть связаны с уровнем образования. Так что это приводит к разложению ошибок: где - компонент ошибки (случайный), который мы можем считать коррелированным с . то есть моделирует ненаблюдаемые навыки индивидуума как случайный индивидуальный компонент.YяTИксяTUяTYяTUяTзнак равноеяT+vяvяИксvя

Таким образом модель становится:

YяTзнак равноΣJθJИксJ+еяT+vя

Эта модель обычно помечается как модель FE, но, как утверждает Вулдридж, было бы разумнее назвать ее моделью RE с коррелированным компонентом ошибки, тогда как если не коррелируется с она становится моделью RE. Таким образом, это ответ на ваш второй вопрос, настройка FE является более общей, поскольку она учитывает корреляцию между и .vяИкс'svяИкс's

В старых книгах по эконометрике, как правило, упоминается FE для модели с индивидуальными конкретными константами, к сожалению, это все еще присутствует в современной литературе (я полагаю, что в статистике у них никогда не было этого заблуждения. Я определенно предлагаю лекции Вулдриджа, которые развивают потенциальную проблему неправильного понимания )


Спасибо за ссылку на (1) отличный ресурс и (2) хорошее объяснение
Stat-R

1
Это другой способ объяснения этих идей, чем я привык видеть, но очень хорошо сделано. +1
gung - Восстановить Монику

15

Мой лучший пример случайного эффекта в модели - клинические испытания. В клинические испытания мы включаем пациентов из разных больниц (так называемых сайтов). Сайты выбираются из большого набора потенциальных сайтов. Могут быть связанные с участком факторы, которые влияют на реакцию на лечение. Таким образом, в линейной модели вы часто хотели бы включить сайт в качестве основного эффекта.

Но уместно ли иметь сайт как фиксированный эффект? Обычно мы этого не делаем. Мы часто можем думать о сайтах, которые мы выбрали для испытания, как случайную выборку из потенциальных сайтов, которые мы могли бы выбрать. Это может быть не совсем так, но это может быть более разумным предположением, чем предположить, что эффект сайта фиксирован. Таким образом, трактовка сайта как случайного эффекта позволяет нам учитывать изменчивость эффекта сайта, которая обусловлена ​​выбором набора из k сайтов из популяции, содержащей N сайтов.

Общая идея заключается в том, что группа не является фиксированной, а была выбрана из более многочисленной группы населения, и другие варианты для группы были возможны и привели бы к другим результатам. Поэтому, рассматривая его как случайный эффект, включаем в модель тот тип изменчивости, который вы не получите от фиксированного эффекта.


Ссылка @ocram довольно интересная. Это указывает на неоднородность в отношении определения FE. Но к какому определению относится Stat-R? Его второй вопрос предполагает, что FE рассматривается как RE с коррелированной случайной составляющей. Согласно этому определению и в вашем примере, FE будет означать, что лечение может быть связано с ненаблюдаемым (или пропущенным) эффектом сайта, верно?
JDav

2
Хорошо - ваш последний абзац - очень краткий способ выразить это. +1
Люк

1
@MichaelChernick: хороший пример. Таким образом, вы утверждаете, что сайт больницы должен рассматриваться как случайный, а не как фиксированный эффект. Но какова будет реальная разница в результатах между этими двумя вариантами? Если мы будем рассматривать его как фиксированный, то мы получим коэффициент регрессии для каждой больницы и сможем проверить, например, является ли основной эффект от больницы значительным. Если мы будем лечить случайно, мы не получим коэффициент регрессии для каждой больницы (правильно?); мы можем все еще проверить главный эффект больницы? Что еще более важно, это может увеличить / уменьшить мощность других основных эффектов / взаимодействий в модели?
говорит амеба, восстанови Монику

12
  1. Не уверен насчет книги, но вот пример. Предположим, у нас есть выборка веса при рождении от большой группы детей в течение длительного периода времени. Вес младенцев, рожденных от одной и той же женщины, будет больше похож на вес младенцев, рожденных от разных матерей. Мальчики также тяжелее девочек.

Итак, модель с фиксированными эффектами, игнорирующая корреляцию весов у детей, рожденных от одной и той же матери:

Модель 1. Средний вес при рождении = перехват + пол

Другая модель с фиксированными эффектами, корректирующая такую ​​корреляцию:

Модель 2. Средний вес при рождении = перехват + пол + mother_id

Однако, во-первых, нас может не интересовать эффект для каждой конкретной матери. Также мы считаем матерью случайную маму из числа всех матерей. Таким образом, мы строим смешанную модель с фиксированным эффектом для пола и случайным эффектом (т.е. случайным перехватом) для матери:

Модель 3: средний вес при рождении = перехват + пол + вы

Это значение будет разным для каждой матери, как в модели 2, но на самом деле оно не оценивается. Скорее, оценивается только его дисперсия. Эта оценка дисперсии дает нам представление об уровне кластеризации весов по матери.

Надеюсь, что это имеет смысл.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.