Допускается сравнение моделей смешанных эффектов (в первую очередь случайные эффекты)


20

Я смотрел на моделирование смешанных эффектов с использованием пакета lme4 в R. Я в основном использую lmerкоманду, поэтому я задам свой вопрос через код, который использует этот синтаксис. Я предполагаю, что общий простой вопрос может состоять в том, можно ли сравнивать любые две модели, построенные с lmerиспользованием отношений правдоподобия на основе идентичных наборов данных? Я считаю, что ответ на этот вопрос должен быть «нет», но я могу быть неверным. Я прочитал противоречивую информацию о том, должны ли случайные эффекты быть одинаковыми или нет, и какой компонент случайных эффектов подразумевается под этим? Итак, я приведу несколько примеров. Я возьму их из данных повторных измерений, используя слово стимулы, возможно, что-то вроде Baayen (2008) будет полезно для интерпретации.

Допустим, у меня есть модель, в которой есть два предиктора с фиксированными эффектами, мы будем называть их A и B, и некоторые случайные эффекты ... слова и субъекты, которые их воспринимали. Я мог бы построить модель, как показано ниже.

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(обратите внимание, что я намеренно пропустил, data =и мы будем предполагать, что я всегда имею в виду REML = FALSEдля ясности)

Теперь о следующих моделях, которые можно сравнить с отношением правдоподобия к приведенному выше, а какие нет?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

Я признаю, что интерпретация некоторых из этих различий может быть трудной или невозможной. Но давайте отложим это на секунду. Я просто хочу знать, есть ли в изменениях что-то фундаментальное, что исключает возможность сравнения. Я также хочу знать, если LRs в порядке, и сравнения AIC, а также.



(Я заметил, что вы удалили тег [проверка гипотезы], который я добавил ранее. Что ж, до вас, но я думаю, что это уместно: проверка отношения правдоподобия - это явно процедура проверки гипотез, а [смешанная модель] + [проверка гипотез ] ИМХО является информативной комбинацией тегов, см. stats.stackexchange.com/questions/tagged/… ),
говорит амеба. Восстановите Монику

Отредактировано, чтобы удалить «тест» из LR. LR можно интерпретировать без тестирования, что делает его более параллельным AIC и лучше соответствует моим реальным намерениям. Спасибо что подметил это.
Джон

Ответы:


13

Используя максимальную вероятность, любой из них можно сравнить с AIC; если фиксированные эффекты одинаковы ( m1до m4), то лучше использовать REML или ML, обычно предпочтительнее REML, но если они различаются, можно использовать только ML. Однако интерпретация обычно затруднительна, когда меняются как фиксированные, так и случайные эффекты, поэтому на практике большинство рекомендует менять только одно или другое за один раз.

Использование теста отношения правдоподобия возможно, но грязно, потому что обычное приближение хи-квадрат не выполняется при тестировании, если компонент дисперсии равен нулю. Смотрите ответ Анико для деталей. (Благодарю Анико за то, что он прочитал вопрос более внимательно, чем я, и достаточно внимательно прочитал мой первоначальный ответ, чтобы заметить, что он упустил этот момент. Спасибо!)

Pinhiero / Bates - это классическая ссылка; это описывает nlmeпакет, но теория та же самая. Ну, в основном то же самое; С момента написания этой книги Даг Бейтс изменил свои рекомендации по выводу, и новые рекомендации отражены в lme4пакете. Но это больше, чем я хочу здесь. Более читаемая ссылка - Weiss (2005), Моделирование продольных данных.


Модели m2 и m4 или m1 и m3 нельзя сравнивать с тестом отношения правдоподобия. Они не являются вложенными моделями.
Макрос

Ой, спасибо, что поймали это, @Macro! Смотрите редактировать.
Аарон - Восстановить Монику

Речь шла просто о сравнении моделей с моделью m, а не друг с другом. Но, тем не менее, вы говорите, что сравнения AIC можно проводить, даже если они не вложены? Ответы на этот вопрос противоречат этому.
Джон

@ Джон, я прочитал эти ответы, но пропустил там, где обсуждается AIC и нет. Я уверен, что все в порядке, но не могли бы вы дать мне более точный указатель на этот момент в ответах?
Аарон - Восстановить Монику

Я отклонил ответ, потому что вы ошибаетесь (или, по крайней мере, вводите в заблуждение) относительно применимости теста отношения правдоподобия.
Анико

12

mmm4σ2=0

mm212χ12+12χ02χ12

Однако, как заявил @Aaron, многие эксперты не рекомендуют проводить такой тест отношения правдоподобия, как этот. Потенциальными альтернативами являются информационные критерии (AIC, BIC и т. Д.) Или начальная загрузка LRT.

[1] Self, SG & Liang, K. Асимптотические свойства оценок максимального правдоподобия и тесты отношения правдоподобия в нестандартных условиях J. Amer. Statist. Доц., 1987, 82, 605-610.


1
Спасибо за информацию LR. Я действительно не задумывался о проблеме границы LR при создании моделей для примера. Я просто заметил, что в вашем ответе неясно, применимы ли ваши рекомендации к простым случаям, таким как сравнение моделей с различными фиксированными эффектами (конечно, по оценке ML).
Джон

Нет, эта проблема возникает только при тестировании компонентов отклонения, а не фиксированных эффектов.
Аарон - Восстановить Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.