Подгонка биномиального GLMM (glmer) к переменной отклика, которая является пропорцией или долей


11

Я надеюсь, что кто-то может помочь с тем, что я считаю относительно простым вопросом, и я думаю, что знаю ответ, но без подтверждения он стал тем, в чем я просто не могу быть уверен.

У меня есть данные подсчета в качестве переменной ответа, и я хочу измерить, как эта переменная изменяется при пропорциональном присутствии чего-либо.

Более подробно, переменная отклика представляет собой подсчет присутствия вида насекомых в ряде мест, поэтому, например, участок отбирается 10 раз, и этот вид может встречаться 4 раза.

Я хочу посмотреть, коррелирует ли это с пропорциональным присутствием группы видов растений в общем сообществе растений на этих участках.

Это означает, что мои данные выглядят следующим образом (это только пример)

Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1

Данные также включают случайный эффект для местоположения.

Я подумал о двух методах, один из которых будет линейной моделью ( lmer) с насекомыми, преобразованными в пропорции, например

 lmer.model<-lmer(insectCount/NumberOfInsectSamples~
 ProportionalPlantGroupPresence+(1|Location),data=Data)

Вторым будет биномиальный GLMM ( glmer), например

glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
 ProportionalPlantGroupPresence+(1|Location),
 data=Data,family="binomial")

Я полагаю, что биномиальный блеск является правильным методом, однако они дают довольно разные результаты. Кажется, я не могу найти окончательного ответа в сети, не чувствуя себя немного неуверенно, и хочу убедиться, что я не ошибаюсь.

Любая помощь или понимание альтернативных методов по этому вопросу будет высоко ценится.


Ответы:


19

Биномиальный GLMM, вероятно, правильный ответ.

  • Особенно с небольшим или умеренным количеством выборок (9 и 10 в вашем примере), распределение переменной отклика, вероятно, будет гетероскедастичным (дисперсия не будет постоянной, и, в частности, будет зависеть от среднего значения систематически) и далеко из нормальности, таким образом, что будет трудно преобразовать, особенно если пропорции близки к 0 или 1 для некоторых значений переменной предиктора. Это делает GLMM хорошей идеей.
  • Вы должны быть осторожны, чтобы проверить наличие / рассредоточение. Если у вас есть одно наблюдение (т. Е. Одна биномиальная выборка / строка в вашем фрейме данных) для каждого местоположения, то ваш (1|Site)случайный эффект будет автоматически обрабатывать это (хотя см. Предостережение в Harrison 2015)
  • если предыдущее предположение верно (у вас есть только одна биномиальная выборка на местоположение), то вы также можете приспособить ее как обычную биномиальную модель ( glm(...,family=binomial)- в этом случае вы также можете использовать квазибиномиальную модель ( family=quasibinomial) в качестве более простого, альтернативного способа для учета чрезмерной дисперсии
  • если вам нравится, вы также можете подогнать свой GLMM с пропорцией в качестве ответа, если вы установите weightsаргумент равным количеству выборок:

     glmer(insectCount/NumberOfInsectSamples~ProportionalPlantGroupPresence+
           (1|Location),
           weights=NumberofInsectSamples,
           data=Data,family="binomial")

    (это должно дать идентичные результаты в glmer()соответствии с вашим вопросом).

Харрисон, Ксавье А. « Сравнение случайного эффекта на уровне наблюдения и бета-биномиальных моделей для моделирования сверхдисперсии в биномиальных данных в экологии и эволюции ». PeerJ 3 (21 июля 2015 г.): e1114. DOI: 10,7717 / peerj.1114.


Привет Бен, большое спасибо за ваш четкий и исчерпывающий ответ!
AL
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.