Бинарные модели (Probit и Logit) с логарифмическим смещением


12

У кого-нибудь есть вывод о том, как смещение работает в бинарных моделях, таких как пробит и логит?

В моей задаче контрольное окно может быть разной длины. Предположим, что пациенты получают профилактический укол в качестве лечения. Выстрел происходит в разное время, поэтому, если результат является бинарным индикатором того, произошли ли какие - либо вспышки, вам необходимо скорректировать тот факт, что у некоторых людей есть больше времени для проявления симптомов. Кажется, что вероятность вспышки пропорциональна продолжительности периода наблюдения. Мне математически не ясно, как бинарная модель со смещением отражает эту интуицию (в отличие от Пуассона).

Смещение является стандартным параметром как в Stata (с.1666), так и в R , и я легко вижу его для Пуассона , но двоичный регистр немного непрозрачен.

Например, если у нас есть

E[y|x]Z=exp{xβ},
это алгебраически эквивалентно модели, где
E[y|x]=exp{xβ+logZ},
которая является стандартной моделью с коэффициентом наlogZограниченным1. Это называетсялогарифмическим смещением. У меня проблемы с выяснением, как это работает, если мы заменимexp{}наΦ()илиΛ() .

Обновление № 1:

Случай с логитом был объяснен ниже.

Обновление № 2:

βx=2z=2xxz

Ответы:


8

Вы всегда можете включить смещение в любой GLM: это просто переменная предиктора, коэффициент которой установлен на 1. Регрессия Пуассона, как оказалось, является очень распространенным случаем использования.

Обратите внимание, что в биномиальной модели аналог лог-экспозиции в качестве смещения является просто биномиальным знаменателем, поэтому обычно нет необходимости указывать его явно. Точно так же, как вы можете смоделировать RV Пуассона как счет с логарифмическим воздействием в качестве смещения, или как отношение с экспозицией в качестве веса, вы можете аналогичным образом смоделировать биномиальное RV как количество успехов и неудач, или как частоту с испытаниями как вес.

logZZp/(1p)

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

Но это не имеет никакого особого значения, как экспозиция в логах в регрессии Пуассона. Тем не менее, если ваша биномиальная вероятность достаточно мала, логистическая модель будет приближаться к модели Пуассона с логарифмической связью (поскольку знаменатель на LHS приближается к 1), и смещение можно рассматривать как термин логарифмического воздействия.

(Проблема, описанная в вашем связанном R-вопросе, была довольно своеобразной.)


Pr(Y=1|X)=Φ(xβ+ln(t))тtt

Это не вероятность, а отношение шансов. Надеюсь, редактирование сделает это более понятным.
Хонг Ой

Выражение проблемы через отношение шансов делает это очень ясным. Что насчет пробита?
Дмитрий Васильевич Мастеров

Я не ожидал бы, что это сработает для пробита или, по крайней мере, будет иметь четкую интерпретацию, поскольку не является канонической связью, а двоичная зависимая переменная с пробитом не попадает в экспоненциальное семейство. Φ()
StasK

@StasK Это кажется правильным, но тогда почему эти опции существуют в Stata и R? Что они делают?
Дмитрий Владимирович Мастеров

1

Пересматривая это как проблему времени до события, разве логистическая модель со смещением ln (time) не даст вам обязательство параметрической функции выживания, которая может или не может хорошо соответствовать данным?

р / (1-р) = Z * ехр (xbeta)

p = [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Прогнозируемое выживание в момент времени Z = 1- [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.