Интерпретация результатов усреднения модели в R


11

Я пытаюсь понять и знать, что сообщать из моего анализа некоторых данных с использованием усреднения модели по R.

Я использую следующий скрипт для анализа влияния метода измерения на данную переменную: Вот набор данных: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

Модель для установки:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

полная модель драга

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

Получить сводную информацию обо всех моделях, чтобы получить оценки параметров

summary(model.avg(d))

Я знаю, что либо все модели могут быть усреднены (полное усреднение модели), либо только их подмножество (условное усреднение). Теперь я хотел бы знать: когда лучше использовать полное или условное усреднение, чтобы сделать выводы. Что я должен сообщить обо всем этом для научной статьи? Что означает именно значение Z и связанный p для модели усреднения ситуации?

Чтобы было проще визуализировать мои вопросы. Вот таблица результатов,

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

Ответы:


5

Смотри Grueber et al. 2011, «Многомодельный вывод в экологии и эволюции: проблемы и решения» Evolutionary Biology 24: 699-711.

Это действительно зависит от целей относительно того, хотите ли вы использовать полные или условные данные. В моей области мы будем использовать критерии, такие как AICC, чтобы определить, какие модели наиболее поддерживаются, а затем использовать их в качестве условного подмножества. Эта информация будет затем сообщена. Например, все ваши первые четыре модели находятся в пределах 2 единиц AIC друг от друга, поэтому все они будут включены в ваше подмножество. Другие выходят из положения (более высокий AIC), поэтому включение информации от них фактически снизит качество ваших бета-оценок.


2
Но даже в предложенном вами примере некоторые термины появятся в двух из четырех «лучших» моделей. Вы берете среднее значение этих двух значений коэффициента или двух значений и двух нулевых значений для двух моделей, где они не отображаются?
user2390246

5

Я думаю, что предположение о разнице между полными и условными средними значениями неверно. Один - это среднее значение, включающее нули (полные), а другое - нули (условные). из файла справки для команды model.avg ():

Запись

Среднее «подмножество» (или «условное») усредняется только по моделям, в которых появляется параметр. Альтернативно, «полное» среднее значение предполагает, что переменная включена в каждую модель, но в некоторых моделях соответствующий коэффициент (и его соответствующая дисперсия) установлены на ноль. В отличие от «среднего подмножества», он не имеет тенденции отклонять значение от нуля. «Полное» среднее является типом оценки усадки, а для переменных со слабой зависимостью от отклика они меньше, чем «подмножественные» оценки.

Если вы хотите использовать только подмножество моделей (например, на основе дельта AIC), используйте аргумент подмножества в model.avg (). Вы по-прежнему будете получать условные и полные оценки, если в некоторых из моделей отсутствуют некоторые переменные, которые есть у других.


Да. Согласен. Это правильная интерпретация.
ecologist1234
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.