Почему нужно использовать REML (вместо ML) для выбора среди вложенных моделей var-covar?


16

Различные описания по выбору модели на случайные эффекты линейных смешанных моделей инструктируют использовать REML. Я знаю разницу между REML и ML на некотором уровне, но я не понимаю, почему REML следует использовать, потому что ML смещен. Например, неправильно ли проводить LRT для параметра дисперсии модели нормального распределения с использованием ML (см. Код ниже)? Я не понимаю, почему в выборе модели важнее быть непредвзятым, чем быть МЛ. Я думаю, что окончательный ответ должен быть «потому что выбор модели работает лучше с REML, чем с ML», но я хотел бы знать немного больше, чем это. Я не читал деривации LRT и AIC (я не достаточно хорош, чтобы понимать их полностью), но если REML явно используется в деривациях, просто зная, что на самом деле будет достаточно (например,

n <- 100
a <- 10
b <- 1
alpha <- 5
beta <- 1
x <- runif(n,0,10)
y <- rnorm(n,a+b*x,alpha+beta*x)

loglik1 <- function(p,x,y){
   a <- p[1]
   b <- p[2]
   alpha <- p[3]
  -sum(dnorm(y,a+b*x,alpha,log=T))
}

loglik2 <- function(p,x,y){
   a <- p[1]
   b <- p[2]
   alpha <- p[3]
   beta <- p[4]
  -sum(dnorm(y,a+b*x,alpha+beta*x,log=T))
}

m1 <- optim(c(a,b,alpha),loglik1,x=x,y=y)$value
m2 <- optim(c(a,b,alpha,beta),loglik2,x=x,y=y)$value
D <- 2*(m1-m2)
1-pchisq(D,df=1) # p-value

1
Что касается REML и AIC, вы должны взглянуть на этот вопрос .
Элвис

Ответы:


13

Очень короткий ответ: REML - это ML, поэтому тест, основанный на REML, в любом случае верен. Так как оценка параметров дисперсии с помощью REML лучше, ее естественно использовать.

Почему РЕМЛ МЛ? Рассмотрим, например, модель с X R n × p , Z R n × q и β R p - вектор фиксированных эффектов, u N ( 0 , τ I q ) - вектор случайных эффектов, и e N ( 0 , σ 2 I n )

Y=Xβ+Zu+e
XRn×pZRn×qβRpuN(0,τIq)eN(0,σ2In), Ограниченное правдоподобие может быть получено путем рассмотрения являются ортонормированным базисом векторного пространства, ортогонального к пространство, генерируемое столбцами X ); тогда C Y = C Z u +npконтрастирует, чтобы "удалить" фиксированные эффекты. Точнее, пусть , такое, что C X = 0 и C C = I n - p (то есть столбцы C CR(np)×nCX=0CC=InpCX с ϵ N ( 0 , σ 2 I n - p ) , а вероятность для τ , σ 2, заданная C Y, является ограниченным правдоподобием.
CY=CZu+ϵ
ϵN(0,σ2Inp)τ,σ2CY

Хороший ответ (+1), могу ли я сказать, что матрица зависит от модели в среднем? Таким образом, вы можете сравнить только оценки REML для той же матрицы C ? CC

Да, зависит от X (я отредактирую ответ через минуту, чтобы прояснить его), поэтому ваши вложенные модели должны иметь одинаковые переменные с фиксированными эффектами. CX
Элвис

REML это не ML! ML однозначно определяется для данной вероятностной модели , но REML зависит от параметров фиксированных эффектов. См., Например, этот комментарий Дуга Бейтса (а также многие исторические комментарии о R-SIG-mixed-models).
Ливиус

1
@ Ливий Я думаю, что мой ответ достаточно ясно показывает, как строится ограниченная вероятность. Это является вероятностью того , что это просто не вероятность того, учитывая наблюдаемое в модели , написанной в первом отображаемое уравнении, но учитывая прогнозируемый вектор C Y в модели написанной во втором отображается уравнение. REML - это ML, полученный по этой вероятности. YCY
Элвис

2
Я думаю, что в этом и заключается смысл протестов DBates по этому вопросу: это другая модель, и это модель, для которой сравнение затруднено, потому что модель и параметризация взаимосвязаны. Таким образом , вы не вычисление в ML для вашей оригинальной модели , но в ML для другой модели , вытекающей из конкретной параметризации исходной модели. Следовательно, REML-модели с вложенными структурами с фиксированными эффектами больше не являются вложенными моделями (как вы упомянули выше). Но ML-подогнанные модели все еще являются вложенными, потому что вы максимизируете вероятность для указанной модели.
Ливий

9

Тесты отношения правдоподобия - это тесты статистических гипотез, основанные на соотношении двух правдоподобий. Их свойства связаны с оценкой максимального правдоподобия (MLE). (см., например, Оценка максимального правдоподобия (MLE) в терминах непрофессионала ).

В вашем случае (см. Вопрос) вы хотите «выбрать» из двух вложенных моделей var-covar. Допустим, вы хотите выбрать модель, в которой var-covar равен и модель, в которой var-covar равен ΣΣg , где вторая (простая модель) является частным случаем первого (общий один). Σs

Тест основан на вероятность того, отношение , где. Σ s и ЕLR=2(log(Ls(Σ^s))log(Lg(Σ^g))Σ^s являются оценки максимального правдоподобия.Σ^g

Статистика является, асимптотически (!) Х 2 . LR χ2

Известно, что оценки максимального правдоподобия являются последовательными, однако во многих случаях они являются предвзятыми. Это тот случай , для оценок MLE для и Е г , это может быть показывают , что они предвзято. Это потому, что они вычисляются с использованием среднего значения, полученного из данных, так что разброс вокруг этого «оценочного среднего» меньше разброса вокруг истинного среднего (см., Например, Интуитивное объяснение деления на n - 1 при расчете стандартного отклонения ? )Σ^sΣ^gn1

Статистики выше, χ 2 в больших образцах, это просто из - за того , что в больших образцах, Σ s и Σ гLRχ2Σ^sΣ^g сходится к их истинным значениям (MLE) согласуется.
(Примечание: в приведенной выше ссылке для очень больших выборок деление на n или на (n-1) не будет иметь значения)

Для небольших образцов, оценивает ОМП Σ s и Σ г будет предвзятый и , следовательно , распределение L R будет отличаться от й 2 , в то время как оценки REML дадут объективные оценки Σ s и Е г , так что если вы используете для выбора модели вар-ковара оценки REML, тогда L R будет для меньших выборок лучше аппроксимироваться χ 2 .Σ^sΣ^gLRχ2ΣsΣgLRχ2

Обратите внимание, что REML следует использовать только для выбора среди вложенных структур var-covar моделей с одинаковым средним значением, для моделей с разными средними значениями REML не подходит, для моделей с разными значениями следует использовать ML.


Утверждение «Статистика LR асимптотически (!) Χ2» в этом случае неверно. Это связано с тем, что если вложено в Σ g , то Σ s находится на границе Σ g . В этом случае распределение χ 2 не выполняется. Например, смотрите здесьΣsΣgΣsΣgχ2
Клифф А.Б.

@Cliff AB, это то, что объясняется ниже этого утверждения, и это причина, по которой вы должны использовать REML.

-4

У меня есть ответ, который больше связан со здравым смыслом, чем со статистикой. Если вы посмотрите на PROC MIXED в SAS, оценка может быть выполнена с помощью шести методов:

http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_mixed_sect008.htm

но REML используется по умолчанию. Почему? По-видимому, практический опыт показал, что он имеет лучшую производительность (например, наименьшая вероятность проблем сходимости). Следовательно, если ваша цель достижима с помощью REML, то имеет смысл использовать REML, а не пять других методов.


2
Это связано с «теорией больших выборок» и предвзятостью оценок MLE, см. Мой ответ.

1
«Это значение по умолчанию в SAS» не является приемлемым ответом на вопрос «почему» на этом сайте.
Пол

Значения p для смешанных моделей, предоставляемых SAS по умолчанию, не предусмотрены в библиотеке lme4 для R, поскольку не заслуживают доверия ( stat.ethz.ch/pipermail/r-help/2006-May/094765.html ). Так что «SAS по умолчанию» может быть даже неправильным.
Тим
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.