Этот вопрос / тема возникла в дискуссии с коллегой, и я искал несколько мнений по этому поводу:
Я моделирую некоторые данные, используя логистическую регрессию со случайными эффектами, точнее - логистическую регрессию со случайным перехватом. Для фиксированных эффектов у меня есть 9 переменных, которые представляют интерес и учитываются. Я хотел бы сделать выбор модели, чтобы найти значимые переменные и дать «лучшую» модель (только основные эффекты).
Моей первой идеей было использование AIC для сравнения разных моделей, но с 9 переменными мне было не очень интересно сравнивать 2 ^ 9 = 512 разных моделей (ключевое слово: выемка данных).
Я обсуждал это с коллегой, и он сказал мне, что он помнил, как читал об использовании пошагового (или прямого) выбора модели с GLMM. Но вместо использования значения p (например, на основе теста отношения правдоподобия для GLMM) следует использовать AIC в качестве критерия входа / выхода.
Мне эта идея показалась мне очень интересной, но я не нашел никаких ссылок, в которых это обсуждалось, и мой коллега не помнил, где он ее читал. Многие книги предлагают использовать AIC для сравнения моделей, но я не нашел никаких обсуждений по поводу использования этого вместе с пошаговой или прямой процедурой выбора модели.
Итак, у меня есть два основных вопроса:
Что-то не так с использованием AIC в пошаговой процедуре выбора модели в качестве критерия входа / выхода? Если да, что будет альтернативой?
Есть ли у вас какие-либо ссылки, которые обсуждают вышеуказанную процедуру (также в качестве ссылки для окончательного отчета?
Лучший,
Эмилия