Ваш вопрос может возникнуть из-за того, что вы имеете дело с коэффициентами и вероятностями, что поначалу сбивает с толку. Поскольку логистическая модель представляет собой нелинейное преобразование вычисления доверительные интервалы не так просты.βTИкс
Фон
Напомним, что для модели логистической регрессии
Вероятность из : р = е α + β 1 х 1 + β 2 х 2( Y= 1 )p=eα+β1x1+β2x21+eα+β1x1+β2x2
Коэффициенты из : ( р(Y=1)(p1−p)=eα+β1x1+β2x2
Вход Коэффициенты из : журнал ( р(Y=1)log(p1−p)=α+β1x1+β2x2
Рассмотрим случай, когда у вас есть увеличение на единицу переменной , т.е.Икс1 , тогда новые шансыИкс1+ 1
шансы(Y= 1 ) =eα +β1(x1+ 1 ) +β2Икс2знак равно еα+β1Икс1+β1+β2Икс2
- Следовательно, коэффициент шансов (ИЛИ)
Odds(x1+1)Odds(x1)=eα+β1(x1+1)+β2x2eα+β1x1+β2x2=eβ1
Интерпретация коэффициентов
Как бы вы интерпретировали значение коэффициента ? Предполагая, что все остальное остается неизменным:βj
- Для каждой единицы увеличения отношение логарифмов увеличивается на β j .xjβj
- Для каждой единицы увеличения отношение шансов увеличивается на e β j .xjeβj
- При каждом увеличении от k до k + Δ отношение шансов увеличивается на e β j Δxjkk+ΔeβjΔ
- Если коэффициент отрицательный, то увеличение приводит к уменьшению отношения шансов.xj
Доверительные интервалы для одного параметра βj
Мне просто нужно использовать ? Или мне нужно конвертировать SE, используя подход, описанный здесь?1.96∗SE
βj оценивается с помощью Maxiumum правдоподобия, теория MLE говорит нам, что он асимптотически нормален, и поэтому мы можем использовать большой выборочный доверительный интервал Вальда, чтобы получить обычный
βj±z∗SE(βj)
eβj±z∗SE(βj)
which is a confidence interval on the odds ratio. Note that these intervals are for a single parameter only.
If I want to understand the standard-error for both variables how would I consider that?
If you include several parameters you can use the Bonferroni procedure, otherwise for all parameters you can use the confidence interval for probability estimates
Bonferroni procedure for several parameters
If g parameters are to be estimated with family confidence coefficient of approximately 1−α, the joint Bonferroni confidence limits are
βg±z(1−α2g)SE(βg)
Confidence intervals for probability estimates
The logistic model outputs an estimation of the probability of observing a one and we aim to construct a frequentist interval around the true probability p such that Pr(pL≤p≤pU)=.95
One approach called endpoint transformation does the following:
- Compute the upper and lower bounds of the confidence interval for the linear combination xTβ (using the Wald CI)
- Apply a monotonic transformation to the endpoints F(xTβ) to obtain the probabilities.
Since Pr(xTβ)=F(xTβ) is a monotonic transformation of xTβ
[Pr(xTβ)L≤Pr(xTβ)≤Pr(xTβ)U]=[F(xTβ)L≤F(xTβ)≤F(xTβ)U]
Concretely this means computing βTx±z∗SE(βTx) and then applying the logit transform to the result to get the lower and upper bounds:
[exTβ−z∗SE(xTβ)1+exTβ−z∗SE(xTβ),exTβ+z∗SE(xTβ)1+exTβ+z∗SE(xTβ),]
The estimated approximate variance of xTβ can be calculated using the covariance matrix of the regression coefficients using
Var(xTβ)=xTΣx
The advantage of this method is that the bounds cannot be outside the range (0,1)
There are several other approaches as well, using the delta method, bootstrapping etc.. which each have their own assumptions, advantages and limits.
Sources and info
My favorite book on this topic is "Applied Linear Statistical Models" by Kutner, Neter, Li, Chapter 14
Otherwise here are a few online sources: