Отвечая на этот вопрос, Джон Кристи предложил оценить соответствие моделей логистической регрессии путем оценки остатков. Я знаком с тем, как интерпретировать невязки в OLS, они находятся в том же масштабе, что и DV, и очень четко различие между y и y, предсказанное моделью. Однако для логистической регрессии, в прошлом я обычно только проверял оценки соответствия модели, например, AIC, потому что я не был уверен, что остаток будет означать для логистической регрессии. Посмотрев в помощь АиР файлы немного , я вижу , что в R существует пять типов GLM остатков доступны, c("deviance", "pearson", "working","response", "partial")
. Файл справки относится к:
- Дэвисон, AC и Снелл, EJ (1991) Остатки и диагностика. В кн .: Статистическая теория и моделирование. В честь сэра Дэвида Кокса, ФРС , ред. Хинкли Д.В., Рейд Н. и Снелл Е.Д., Чепмен и Холл.
У меня нет копии этого. Есть ли короткий способ описать, как интерпретировать каждый из этих типов? В логистическом контексте сумма квадратов остатков обеспечит значимую меру соответствия модели или лучше использовать критерий информации?
binnedplot
функция в руке пакета R дает очень полезный график остатков. Это хорошо описано на стр.97-101 Gelman and Hill 2007 .