Проблема со сравнением моделей GLM с другой функцией связи


12

Учитывая тот же набор ковариат и семейства распределений, как я могу сравнить модели, имеющие разные функции связи?

Я думаю, что правильный ответ здесь - «AIC / BIC», но я не уверен на 100%.

Можно ли иметь вложенные модели, если у них другая ссылка?


Обратите внимание, что «AIC / BIC» является одним из возможных ответов, но, в принципе, может использоваться любая (соответствующая) методика выбора модели.

2
Нет, они не вложенные. Кроме того , напомним , что при использовании AIC / BIC, константы нормализации значения , а также.

5
Информационные критерии, такие как AIC и BIC, просто корректируют отклонение модели в зависимости от ее сложности (т. Е. Количества параметров). Если у вас одинаковое количество ковариат (даже не обязательно одинаковых ковариат), эта корректировка не будет иметь значения. Вы можете проверить их, сравнив отклонения напрямую. Возможно, вам будет полезно прочитать мой ответ здесь: различие между логитами и пробитами , которое затрагивает эту проблему.
gung - Восстановить Монику

3
Еще одна возможность для сравнения моделей, которая носит общий характер, но требует большего от вас, - это использовать метод параметрической начальной загрузки. Вы можете найти PDF здесь .
gung - Восстановить Монику

2
Есть ли у вас какая-то особая семья с двумя возможными функциями связи? т.е. биноминальное семейство, логит против лога, ссылка?
Плацидия

Ответы:


9

Для решения этой проблемы вы также можете использовать так называемые «тесты добросовестности ссылок», каноническая трактовка которых была опубликована Дэрилом Прегибоном в «Прикладной статистике» в 1980 году. Возможно, вы захотите прочитать статью здесь.

На этом фронте также была проведена более поздняя работа, в частности, Ченом и У в их статье JASA 1994 года .

Как утверждает @gung, использование девиации также возможно, см., Например, эту статью, если вы не хотите брать ее по номиналу.


3
+1, приятно иметь каноническую статью. Кстати, я подозреваю, что вы имели в виду недавнюю работу, а не "разумную" работу.
gung - Восстановить Монику

6

(Я просто копирую информацию из комментариев здесь, чтобы этот вопрос не отображался как официально оставшийся без ответа.)

Вы можете сравнить две модели, сравнивая отклонения. Все, что делают AIC и BIC - это регулируют отклонения для количества параметров в модели. Так как это число одинаково, это не будет иметь никакого значения. В целом, будет очень трудно провести различие между различными функциями связи, если они не различаются по форме; часто лучше использовать теоретические знания, чтобы определить подходящую функцию связи. Например, ссылки logit и probit почти не различаются по форме, но различаются в том, как вы думаете о процессе генерации данных (как я обсуждаю здесь ).

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.