Выбор модели с логистической регрессией Ферт


21

В небольшом наборе данных ( ), с которым я работаю, несколько переменных дают мне идеальный прогноз / разделение . Таким образом, я использую логистическую регрессию Фёрта для решения этой проблемы.N~100

Если я выберу лучшую модель по AIC или BIC , должен ли я включить штрафной штраф Ферт в вероятность при вычислении этих информационных критериев?


2
Не могли бы вы объяснить, почему это неизбежно, поскольку выбор переменных не помогает решить проблему «слишком много переменных, слишком маленький размер выборки»?
Фрэнк Харрелл

4
Это так плохо, как только может.
Фрэнк Харрелл

1
Рассматривали ли вы решение этой проблемы байесовского вывода? Логистическая регрессия Ферт эквивалентна MAP с Джеффри до. Вы можете использовать аппроксимацию полностью по Лапласу для оценки предельных правдоподобий - что похоже на скорректированный BIC (аналогичный AICc)
вероятностный

1
@user, потому что такие переменные обычно предсказывают только несколько случаев, и это невоспроизводимо: истинная вероятность для этой ячейки может быть близка к 90%, скажем, но с двумя случаями в ней вы получите два случая в 81% случаев ,
StasK

1
Ссылка для скачивания статьи K & K (1996), найденной в Google Scholar, bemlar.ism.ac.jp/zhuang/Refs/Refs/kitagawa1996biometrika.pdf
Алекос Пападопулос

Ответы:


1

Если вы хотите обосновать использование BIC: вы можете заменить максимальное правдоподобие оценкой максимального апостериорного значения (MAP), и полученный критерий типа BIC остается асимптотически верным (в качестве размера выборки ). Как упомянуто @probabilityislogic, логистическая регрессия Фёрта эквивалентна использованию априора Джеффри (так что то, что вы получаете из своего регрессионного соответствия, это MAP).N

BIC - это псевдобайесовский критерий, который (приблизительно) получен с использованием разложения вероятности вокруг оценки максимального правдоподобия . Таким образом, он игнорирует предыдущее, но эффект последнего исчезает, когда информация концентрируется в вероятности.

пY(Y)знак равноL(θ;Y)π(θ)dθ
θ^

В качестве побочного замечания, регрессия Фёрта также устраняет смещение первого порядка в экспоненциальных семействах.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.