Как реализовать смешанную модель с использованием функции бетарег в R?

У меня есть набор данных, состоящий из пропорций, которые измеряют «уровень активности» отдельных головастиков, поэтому устанавливаются значения между 0 и 1. Эти данные были собраны путем подсчета количества перемещений человека за определенный промежуток времени (1 для движения, 0 для отсутствия движения), а затем усредняется, чтобы создать одно значение на человека. Моим основным фиксированным эффектом будет «уровень плотности».

Проблема, с которой я сталкиваюсь, заключается в том, что у меня есть фактор-переменная, «пруд», которую я хотел бы включить в качестве случайного эффекта - меня не волнуют различия между прудами, но я хотел бы учитывать их статистически. Одним из важных моментов, касающихся прудов, является то, что у меня их всего 3, и я понимаю, что идеально иметь больше уровней факторов (5+) при работе со случайными эффектами.

Если это возможно, я хотел бы получить несколько советов о том, как реализовать смешанную модель с использованием betareg()или betamix()в R. Я прочитал файлы справки R, но обычно мне трудно их понять (что на самом деле означает каждый параметр аргумента в контексте моих собственных данных И что означают выходные значения в экологическом плане) и поэтому я склонен работать лучше на примерах.

В связи с этим мне было интересно, могу ли я вместо этого использовать glm()семейство ниже бинома и ссылку logit, чтобы выполнить учет случайных эффектов с данными такого рода.

— Kat Y
источник

нет, вы не можете использовать термины ошибок в glm (). Как насчет logit преобразует ваш ответ и рассматривает линейную смешанную модель?

— Утоби

@utobi Спасибо, я попробую это. Таким образом, у вас нет проблем, имеющих случайный эффект только с 3 уровнями?

— Kat Y

Я не знаю значения вашей переменной «пруд», но если вы повторили измерения, случайные эффекты почти необходимы. В случае, если у вас нет повторяющихся мер, здесь случайные и фиксированные - это открытая дискуссия. Три уровня случайных эффектов могут быть в порядке, в принципе их дисперсия оценивается. Я предлагаю вам проверить литературу в вашей области. Хорошей книгой, в которой обсуждаются случайные и фиксированные эффекты, является stat.columbia.edu/~gelman/arm .

— Утоби

@utobi спасибо за ваш совет. Это было полезно. Я посмотрю на эту книгу! Я закончил делать преобразования логита и использовал lmer ().

— Kat Y

Проверьте этот ответ stats.stackexchange.com/questions/167340/…

— Diogo B Provete

Ответы:

Текущие возможности betaregне включают случайные / смешанные эффекты. В betareg()него можно включить только фиксированный эффект, например, для вашей трехуровневой прудовой переменной. В betamix()функции реализует конечный смесь бета - регрессии, а не смешанные эффекты бета - регрессии.

В вашем случае я бы сначала попытался выяснить, какой эффект оказывает эффект фиксированного фактора пруда. Это «стоит» вам двух степеней свободы, в то время как случайный эффект будет немного дешевле только с одной дополнительной степенью свободы. Но я был бы удивлен, если бы два подхода привели к очень различным качественным взглядам.

Наконец, пока glm()не поддерживается бета-регрессия, но в mgcvпакете есть betar()семейство, которое можно использовать с gam()функцией.

— Ахим Цейлейс
источник

Спасибо за ваш вклад. Вы разъяснили некоторые аспекты функций betareg. На данный момент я воспользовался советом @utobi и выполнил преобразования logit, чтобы я мог использовать lmer (). Я рассмотрю gam (), так как мой следующий набор данных также ограничен между 0 и 1, и я не могу нормализовать распределения с помощью преобразований :)

— Kat Y

Я ожидаю, что подходы дают схожие результаты, но также и некоторые отличия, из которых вы могли бы кое-что узнать. Поэтому я бы рекомендовал попробовать все три, то есть betaregс фиксированными эффектами, логит-преобразованными lmerсо случайными эффектами и gamс betar. (А также: если ответ был полезен, рассмотрите возможность голосования или принятия его.)

— Ахим Цейлейс

Пакет glmmTMB может быть полезен для тех, у кого похожий вопрос. Например, если вы хотите включить пруд из приведенного выше вопроса в качестве случайного эффекта, следующий код поможет вам:

glmmTMB(y ~ 1 + (1|pond), df, family=list(family="beta",link="logit"))

— Кори К
источник

Добро пожаловать в резюме. Спасибо за ваш вклад. Это скорее комментарий, чем ответ. Можете ли вы расширить свой ответ, пожалуйста?

— Ферди

Извините за задержку, я не сразу увидел комментарий. Надеюсь, это поможет.

— Кори К

Это началось как комментарий, но продолжалось долго. Я не думаю, что здесь подходит модель случайных эффектов. Есть только 3 пруда - вы хотите оценить дисперсию по 3 числам? Это то, что происходит с моделью случайных эффектов. Я предполагаю, что пруды были выбраны из-за их удобства для исследователя, а не в качестве случайной выборки «Прудов Америки».

Преимущество модели случайных эффектов заключается в том, что она позволяет построить доверительный интервал для ответа (уровень активности), который учитывает вариации от пруда к пруду. Модель с фиксированными эффектами - другими словами, рассматривая пруд как блок - корректирует реакцию на эффект пруда. Если бы был некоторый дополнительный лечебный эффект - скажем, два вида лягушек в каждом пруду - блокирование уменьшает среднеквадратичную ошибку (знаменатель F-теста) и позволяет проявиться эффекту обработки.

В этом примере эффект лечения отсутствует, а количество прудов слишком мало для модели со случайными эффектами (и, вероятно, слишком «неслучайно»), поэтому я не уверен, какие выводы можно сделать из этого исследования. Можно было бы получить хорошую оценку разницы между прудами, но это все. Я не вижу выводов о более широкой популяции лягушек в других прудах. Полагаю, это можно было бы представить в качестве экспериментального исследования.

Имейте в виду, что любое использование модели случайных эффектов дает очень ненадежную оценку дисперсии пруда и должно использоваться с осторожностью.

Но что касается вашего первоначального вопроса - разве это не проблема скорости? Распределение событий для событий за единицу времени - Пуассон. Таким образом, вы можете выполнить регрессию Пуассона, используя отсчеты с интервалом времени в качестве смещения.

— Placidia
источник