В стандартной множественной линейной регрессии способность подгонять оценки обыкновенных наименьших квадратов (OLS) в два этапа приходит из теоремы Фриша – Во – Ловелла . Эта теорема показывает, что оценка коэффициента для конкретного предиктора в множественной линейной модели равна оценке, полученной путем регрессии остатков ответа (остатков от регрессии переменной ответа против других объясняющих переменных) по отношению к остаткам предиктора (остаткам). от регрессии предикторной переменной к другим объясняющим переменным). Очевидно, вы ищете аналогию с этой теоремой, которая может быть использована в модели логистической регрессии.
Для этого вопроса полезно вспомнить латентно-переменную характеристику логистической регрессии :
Yi=I(Y∗i>0)Y∗i=β0+βXxi+βZzi+εiεi∼IID Logistic(0,1).
В этой характеристике модели переменная скрытого ответа ненаблюдаема, и вместо этого мы наблюдаем индикатор который сообщает нам, является ли скрытый ответ положительным. Эта форма модели выглядит аналогично множественной линейной регрессии, за исключением того, что мы используем немного другое распределение ошибок (логистическое распределение вместо нормального распределения), и, что более важно, мы наблюдаем только показатель, показывающий, является ли скрытый ответ положительным ,Y∗iYi
Это создает проблему для любой попытки создать двухэтапное соответствие модели. Эта теорема Фриша-Во-Ловелла зависит от способности получать промежуточные невязки для отклика и интересующего предиктора, взятые против других объясняющих переменных. В данном случае мы можем получить невязки только из «категорированной» переменной ответа. Создание двухэтапного процесса подбора для логистической регрессии потребует от вас использования остатков ответов из этой категорированной переменной ответа без доступа к скрытому ответу. Это кажется мне серьезным препятствием, и, хотя это не доказывает невозможности, представляется маловероятным, что модель будет соответствовать двум этапам.
Ниже я дам вам отчет о том, что потребуется для нахождения двухэтапного процесса, подходящего для логистической регрессии. Я не уверен, есть ли решение этой проблемы, или есть доказательство невозможности, но материал здесь должен помочь вам понять, что требуется.
Как будет выглядеть двухэтапная логистическая регрессия? Предположим, что мы хотим построить двухступенчатое соответствие для модели логистической регрессии, где параметры оцениваются посредством оценки максимального правдоподобия на каждом шаге. Мы хотим, чтобы процесс включал промежуточный этап, который подходит для следующих двух моделей:
Yi=I(Y∗∗i>0)Y∗∗i=α0+αXxi+τi Zi=γ0+γXxi+δiτi∼IID Logistic(0,1),δi∼IID g.
Мы оцениваем коэффициенты этих моделей (через MLE), и это дает промежуточные подгонянные значения . Затем на втором этапе мы подгоняем модель:α^0,α^X,γ^0,γ^X
Yi=logistic(α^0+α^1xi)+βZ(zi−γ^0−γ^Xxi)+ϵiϵi∼IID f.
Как указано, в процедуре много фиксированных элементов, но функции плотности и на этих этапах остаются неопределенными (хотя они должны быть распределениями с нулевым средним, которые не зависят от данных). Чтобы получить двухступенчатый метод подгонки под эти ограничения, нам нужно выбрать и чтобы MLE для в этом двухступенчатом алгоритме модели был таким же, как MLE, полученный из одношаговой модели логистической регрессии. над.gfgfβZ
Чтобы увидеть, возможно ли это, мы сначала запишем все оценочные параметры из первого шага:
ℓy|x(α^0,α^X)ℓz|x(γ^0,γ^X)=maxα0,αX∑i=1nlnBern(yi|logistic(α0+αXxi)),=maxγ0,γX∑i=1nlng(zi−γ0−γXxi).
Пусть чтобы функция логарифмического правдоподобия для второго шага была:ϵi=yi−logistic(α^0−α^1xi)+βZ(zi−γ^0−γ^Xxi)
ℓy|z|x(βZ)=∑i=1nlnf(yi−logistic(α^0−α^1xi)+βZ(zi−γ^0−γ^Xxi)).
Мы требуем, чтобы максимальное значение этой функции было MLE модели множественной логистической регрессии. Другими словами, мы требуем:
arg max βXℓy|z|x(βZ)=arg max βXmaxβ0,βZ∑i=1nlnBern(yi|logistic(β0+βXxi+βZzi)).
Я оставляю это на усмотрение других, чтобы определить, есть ли решение этой проблемы или доказательство отсутствия решения. Я подозреваю, что «категоризация» скрытой переменной ответа в логистической регрессии сделает невозможным поиск двухэтапного процесса.