Опущенное переменное смещение в логистической регрессии по сравнению с пропущенным переменным смещением в обычной регрессии наименьших квадратов


17

У меня есть вопрос об опущенном переменном смещении в логистической и линейной регрессии.

Скажем, я опускаю некоторые переменные из модели линейной регрессии. Сделайте вид, что эти пропущенные переменные не связаны с переменными, которые я включил в мою модель. Эти пропущенные переменные не смещают коэффициенты в моей модели.

Но в логистической регрессии я только что узнал, что это не так. Пропущенные переменные будут смещать коэффициенты включенных переменных, даже если пропущенные переменные не связаны с включенными переменными. Я нашел статью на эту тему, но я не могу сделать из этого ни головы, ни хвоста.

Вот бумага и несколько слайдов PowerPoint.

Смещение, по-видимому, всегда к нулю. Кто-нибудь может объяснить, как это работает?


Вы знакомы с тем, как модель логистической регрессии возникает из базовой модели линейной регрессии с «скрытой переменной»?
Алекос Пападопулос

@AlecosPapadopoulos Я, например, нет. Что за блюдо?
Алексис

Есть другие статьи, которые обсуждают это, но та, на которую вы ссылаетесь, самая простая, которую я знаю. Поэтому я не думаю, что смогу улучшить это.
Мартен Буис

Уважаемый г-н Пападопулос, я прочитал идею о латентных переменных. Почему ты спрашиваешь?
ConfusedEconometricsUndergrad

@ Alexis Смотрите, например, этот пост, stats.stackexchange.com/questions/80611/… , и статью в Википедии, en.wikipedia.org/wiki/… . Этот подход также проясняет, что это допущение, которое мы делаем для члена ошибки базовой модели, определяет, какую модель мы получим на уровне вероятностей. Для другого примера, если мы предположим, что основная ошибка следует за униформой, мы получим линейную вероятностную модель, см. Stats.stackexchange.com/questions/81789
Alecos Papadopoulos

Ответы:


20

Случай «смещения ослабления» может быть более четко представлен, если мы рассмотрим «пробитную» модель, но результат переносится и на логистическую регрессию.

Под моделями условной вероятности (модели логистики (логит), «пробит» и «линейная вероятность») мы можем постулировать модель скрытой (ненаблюдаемой) линейной регрессии:

Y*знак равноИксβ+U

где - непрерывная ненаблюдаемая переменная (а - матрица регрессора). Предполагается, что погрешность не зависит от регрессоров и соответствует распределению, плотность которого симметрична относительно нуля , и в нашем случае стандартное нормальное распределение . X F U ( u ) = Φ ( u )Y*ИксFU(U)знак равноΦ(U)

Мы предполагаем, что то, что мы наблюдаем, то есть двоичная переменная , является функцией-индикатором ненаблюдаемой :y YY*

Yзнак равно1еслиY*>0,Yзнак равно0еслиY*0

Затем мы спрашиваем "какова вероятность того, что примет значение учетом регрессоров?" (т.е. мы смотрим на условную вероятность). Это1Y1

P(y=1X)=P(y>0X)=P(Xβ+u>0X)=P(u>XβX)=1Φ(Χβ)=Φ(Xβ)

последнее равенство обусловлено «отражающим» свойством стандартной кумулятивной функции распределения, которая исходит из симметрии функции плотности около нуля. Обратите внимание, что, хотя мы и предположили, что не зависит от , необходимо кондиционирование на , чтобы рассматривать величину как неслучайную.X X X βuXXXβ

Если предположить, что , то мы получим теоретическую модельXβ=b0+b1X1+b2X2

(1)P(y=1X)=Φ(b0+b1X1+b2X2)

Пусть теперь не зависит от и ошибочно исключен из спецификации базовой регрессии. Итак, мы указываемX 1X2X1

y=b0+b1X1+ϵ
Предположим далее, что также является нормальной случайной величиной . Но это означает, чтоX2X2N(μ2,σ22)

ϵ=u+b2X2N(b2μ2,1+b22σ22)

из-за замыкания при сложении нормального распределения (и предположения о независимости). Применяя ту же логику, что и раньше, здесь мы имеем

P(y=1X1)=P(y>0X1)=P(b0+b1X1+ϵ>0X1)=P(ϵ>b0b1X1X1)

Стандартизация переменной мы имеемϵ

P(y=1X1)=1P(ϵb2μ21+b22σ22(b0+b2μ2)1+b22σ22b11+b22σ22X1X1)

(2)P(y=1X1)=Φ((b0+b2μ2)1+b22σ22+b11+b22σ22X1)

и можно сравнить модели и .(1)(2)

Приведенное выше теоретическое выражение говорит нам, где собирается сходиться наша оценка максимального правдоподобия , поскольку она остается последовательной оценкой, в том смысле, что она будет сходиться к теоретической величине, которая действительно существует в модели (и, конечно, не в ощущение, что он найдет «правду» в любом случае)b1

b^1pb11+b22σ22|b^1|<|b1|

что является результатом «смещения к нулю».

Мы использовали пробитную модель, а не логит (логистическая регрессия), потому что только при нормальных условиях мы можем получить распределение . Логистическое распределение не закрыто при добавлении. Это означает, что если мы опускаем соответствующую переменную в логистической регрессии, мы также создаем неправильную спецификацию распределения, поскольку термин ошибки (который теперь включает пропущенную переменную) больше не следует за логистическим распределением. Но это не меняет результат смещения (см. Сноску 6 в статье, на которую ссылается OP).ϵ

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.