Остаточная диагностика и однородность дисперсий в линейной смешанной модели


10

Прежде чем задать этот вопрос, я сделал поиск наш сайт и нашел много подобных вопросов, (например , здесь , здесь и здесь ). Но я чувствую, что эти смежные вопросы не получили должного ответа или обсуждения, поэтому я хотел бы снова поднять этот вопрос. Я чувствую, что должно быть большое количество аудитории, которая хотела бы, чтобы подобные вопросы были объяснены более четко.

Для моих вопросов сначала рассмотрим линейную модель смешанных эффектов,

y=Xβ+Zγ+ϵ
где Xβ - линейный компонент с фиксированными эффектами, Z - дополнительная матрица дизайна, соответствующая параметрам случайных эффектов , γ . И ϵ  N(0,σ2I) - это обычный термин ошибки.

Давайте предположим, что единственным фактором с фиксированным эффектом является категориальная переменная Лечение с тремя различными уровнями. И единственным фактором случайного эффекта является переменная Тема . Тем не менее, у нас есть модель смешанного эффекта с фиксированным эффектом лечения и случайным эффектом субъекта.

Мои вопросы, таким образом, таковы:

  1. Существует ли однородность предположения о дисперсии в линейной смешанной модели, аналогичной традиционной модели линейной регрессии? Если да, что конкретно означает это предположение в контексте задачи о линейной смешанной модели, изложенной выше? Каковы другие важные предположения, которые необходимо оценить?

Мои мысли: ДА. допущения (я имею в виду, среднее значение с нулевой ошибкой и равная дисперсия) все еще отсюда: . В традиционной модели линейной регрессии мы можем сказать, что предположение состоит в том, что «дисперсия ошибок (или просто дисперсия зависимой переменной) постоянна на всех 3 уровнях лечения». Но я заблудился, как мы можем объяснить это предположение в условиях смешанной модели. Должны ли мы сказать, что «различия постоянны для трех уровней лечения, обусловливая предметы?» Или нет?ϵ  N(0,σ2I)

  1. Онлайновый документ SAS об остатках и диагностике влияния поднял два разных остатка, а именно: Маргинальные остатки , и Условные остатки , Мой вопрос: для чего используются два остатка? Как мы могли бы использовать их для проверки предположения об однородности? Для меня только маргинальные остатки могут быть использованы для решения проблемы однородности, так как это соответствует модели. Правильно ли мое понимание здесь? г с = У - Х β - Z γ = г м - Z γ . ε

    rm=YXβ^
    rc=YXβ^Zγ^=rmZγ^.
    ϵ
  2. Существуют ли какие-либо тесты для проверки предположения об однородности в линейной смешанной модели? @Kam указал ранее на тест Левена , будет ли это правильный путь? Если нет, каковы направления? Я думаю, что после того, как мы подойдем к смешанной модели, мы сможем получить невязки и, возможно, сможем провести некоторые тесты (например, тест на пригодность?), Но не уверены, как это будет.

  3. Я также заметил, что есть три типа остатков от Proc Mixed в SAS, а именно: Необработанный остаток , Исследованный остаток и остаток Пирсона . Я могу понять различия между ними с точки зрения формул. Но мне они кажутся очень похожими, когда дело доходит до реальных графиков данных. Так как же их использовать на практике? Есть ли ситуации, когда один тип предпочтительнее других?

  4. Для примера реальных данных следующие два остаточных графика взяты из Proc Mixed в SAS. Как можно предположить, что предположение об однородности дисперсий?

[Я знаю, у меня есть пара вопросов здесь. Если бы вы могли высказать мне свои мысли по любому вопросу, это здорово. Не нужно обращаться ко всем из них, если вы не можете. Я действительно хочу обсудить их, чтобы получить полное понимание. Спасибо!]

Вот предельные (необработанные) остаточные участки. Вот предельные (необработанные) остаточные участки.

Вот условные (необработанные) остаточные участки. Вот условные (необработанные) остаточные участки.


Ответы:


3

Я думаю, что вопросы 1 и 2 взаимосвязаны. Во-первых, отсюда вытекает однородность предположения о дисперсии, . Но это предположение можно смягчить до более общих дисперсионных структур, в которых допущение однородности не является необходимым. Это означает, что это действительно зависит от того, как предполагается распределение .εϵ  N(0,σ2I)ϵ

Во-вторых, условные невязки используются для проверки распределения (таким образом, любых предположений, связанных с) , тогда как предельные невязки могут использоваться для проверки общей структуры дисперсии.ϵ


Я сталкиваюсь с некоторыми из тех же проблем, что и @AaronZeng. Что значит «проверить общую структуру отклонений», для чего следует использовать предельные остатки? Как можно это сделать, и почему бы не сосредоточиться на проверке структуры дисперсии для ? Спасибо. γ
кларпол

1

Это действительно широкая тема, и я приведу только общую картину о связи со стандартной линейной регрессией.

В модели, указанной в вопросе, если , где обозначает субъект или кластер. Пусть . Используя разложение Холецкого , мы можем преобразовать матрицу результатов и дизайна,

yiN(Xiβ,ZiDZi+σ2I),
γiN(0,D)iΣi=ZiDZi+σ2IΣi=LiLi
yi=Li1yi;Xi=Li1Xi.

Как отмечено в Прикладном продольном анализе (стр. 268), обобщенная оценка наименьших квадратов (GLS) для (регрессия на ) может быть переоценена из регрессии OLS на . Таким образом, все встроенные остаточные средства диагностики из полученного OLS могут быть использованы здесь .y i X i y i X iβyiXiyiXi

Что нам нужно сделать, это:

  1. оценка из (предельной) оценки остаточного или дисперсионного компонента в линейной смешанной модели;Σi
  2. заново установить регрессию OLS с использованием преобразованных данных.

Регрессия OLS предполагает независимые наблюдения с однородной дисперсией, поэтому к ее остаткам можно применять стандартные методы диагностики.

Гораздо больше подробностей можно найти в главе 10 «Остаточный анализ и диагностика» книги « Прикладной продольный анализ» . Они также обсуждали преобразование остатка с помощью , и есть некоторые графики (преобразованных) остатков (против предсказанных значений или предикторов). Дополнительные чтения перечислены в 10.8 «Дальнейшие чтения» и Библиографические примечания в них.Li

Кроме того, на мой взгляд, учитывая, что мы предполагаем, что независимы с однородной дисперсией, мы можем проверить эти предположения относительно условных невязок, используя инструменты стандартной регрессии.ϵ


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.