Интерпретация exp (B) в полиномиальной логистической регрессии


16

Это вопрос новичка, но как интерпретировать результат exp (B), равный 6.012, в модели полиномиальной логистической регрессии?

1) 6,012-1,0 = 5,012 = 5012% увеличения риска?

или

2) 6.012 / (1 + 6.012) = 0,857 = 85,7% увеличение риска?

В случае, если обе альтернативы неверны, кто-то может указать правильный путь?

Я искал много ресурсов в Интернете, и я нашел эти две альтернативы, и я не совсем уверен, какой из них правильный.

Ответы:


35

Нам потребуется некоторое время, чтобы добраться до него, но в итоге, изменение в одну единицу в переменной, соответствующей B, умножит относительный риск результата (по сравнению с базовым результатом) на 6.012.

Можно выразить это как увеличение относительного риска на «5012%» , но это путающий и потенциально вводящий в заблуждение способ сделать это, потому что он предполагает, что мы должны думать об изменениях аддитивно, тогда как на самом деле многочленная логистическая модель настоятельно рекомендует нам мыслить мультипликативно. Модификатор «относительный» является существенным, поскольку изменение в переменной одновременно изменяет прогнозируемые вероятности всех результатов, а не только рассматриваемого, поэтому мы должны сравнивать вероятности (с помощью соотношений, а не разностей).

Остальная часть этого ответа развивает терминологию и интуицию, необходимые для правильной интерпретации этих утверждений.

Фон

Давайте начнем с обычной логистической регрессии, а затем перейдем к полиномиальному случаю.

Для зависимой (двоичной) переменной Y и независимых переменных Xi модель

Pr[Y=1]=exp(β1X1++βmXm)1+exp(β1X1++βmXm);

эквивалентно, предполагая, что ,0Pr[Y=1]1

log(ρ(X1,,Xm))=logPr[Y=1]Pr[Y=0]=β1X1++βmXm.

(Это просто определяет , который является коэффициентом как функция .)X яρXi

Без потери общности индексируйте так, чтобы была переменной, а - «B» в вопросе (чтобы ). Исправление значений и варьирование на небольшое количество приводит кX m β m exp ( β m ) = 6,012 X i , 1 i < m X m δXiXmβmexp(βm)=6.012Xi,1i<mXmδ

log(ρ(,Xm+δ))log(ρ(,Xm))=βmδ.

Таким образом, - это предельное изменение коэффициентов входа в систему по отношению к .х мβm Xm

Чтобы восстановить , очевидно, мы должны установить и степень левую часть:δ = 1exp(βm)δ=1

exp(βm)=exp(βm×1)=exp(log(ρ(,Xm+1))log(ρ(,Xm)))=ρ(,Xm+1)ρ(,Xm).

Это показывает как отношение шансов для увеличения на одну единицу . Чтобы понять, что это может значить, составьте таблицу некоторых значений для диапазона начальных шансов, сильно округляя, чтобы выделить шаблоны:X mexp(βm)Xm

Starting odds  Ending odds  Starting Pr[Y=1]  Ending Pr[Y=1]
0.0001         0.0006       0.0001            0.0006
0.001          0.006        0.001             0.006
0.01           0.06         0.01              0.057
0.1            0.6          0.091             0.38
1.             6.           0.5               0.9
10.            60.          0.91              1.
100.           600.         0.99              1.

Для действительно малых коэффициентов, которые соответствуют действительно малым вероятностям, эффект увеличения на одну единицу заключается в умножении коэффициентов или вероятности примерно на 6,012. Коэффициент мультипликации уменьшается по мере увеличения шансов (и вероятности) и практически исчезает, когда шансы превышают 10 (вероятность превышает 0,9).Xm

Коэффициент изменения вероятности

Что касается аддитивного изменения, то между вероятностью 0,0001 и 0,0006 (только 0,05%) нет большой разницы, а между 0,99 и 1 не существует большой разницы (только 1%). Наибольший аддитивный эффект возникает, когда коэффициент равен , где вероятность изменяется от 29% до 71%: изменение + 42%.1/6.0120.408

Аддитивное изменение в вероятности

мы видим, что если мы выражаем «риск» как отношение шансов, то = «B» имеет простую интерпретацию - отношение шансов равно для увеличения единицы в но когда мы выражаем риск в некоторых В другом способе, таком как изменение вероятностей, интерпретация требует осторожности для определения начальной вероятности.β m X mβmβmXm

Полиномиальная логистическая регрессия

(Это было добавлено для последующего редактирования.)

Признав ценность использования лог-шансов для выражения шансов, давайте перейдем к полиномиальному случаю. Теперь зависимая переменная может быть равна одной из категорий , проиндексированных с помощью . Относительная вероятность того, что она находится в категории естьk 2 i = 1 , 2 , , k iYk2i=1,2,,ki

Pr[Yi]exp(β1(i)X1++βm(i)Xm)

с параметрами которые будут определены, и записью для . В качестве аббревиатуры напишем правое выражение как или, если и удалены из контекста, просто . Нормализация для суммирования всех этих относительных вероятностей в единицу дает Y i Pr [ Y = категория  i ] p i ( X , β ) X β p iβj(i)YiPr[Y=category i]pi(X,β)Xβpi

Pr[Yi]=pi(X,β)p1(X,β)++pm(X,β).

(Существует двусмысленность в параметрах: их слишком много. Традиционно для сравнения выбирают «базовую» категорию, и все ее коэффициенты устанавливаются равными нулю. Однако, хотя это необходимо для сообщения об уникальных оценках бета-версий, оно не нужно интерпретировать коэффициенты для поддержания симметрии -. то есть, чтобы избежать каких - либо искусственных различий между категориями - давайте не будем применять любое такое ограничение , если мы не должны).

Один из способов интерпретации этой модели - запросить предельную скорость изменения логарифмических коэффициентов для любой категории (скажем, категории ) по отношению к любой из независимых переменных (скажем, ). То есть, когда мы немного меняем , это вызывает изменение логарифмов . Нас интересует постоянная пропорциональности, связанная с этими двумя изменениями. Цепное правило исчисления вместе с небольшой алгеброй говорит нам, что скорость измененияX J X J Y яiXjXjYi

 log odds(Yi) Xj=βj(i)βj(1)p1++βj(i1)pi1+βj(i+1)pi+1++βj(k)pkp1++pi1+pi+1++pk.

Это имеет относительно простую интерпретацию как коэффициент для в формуле для вероятности того, что находится в категории минус «корректировка». Корректировка - это взвешенное по вероятности среднее значение коэффициентов во всех других категориях . Веса вычисляются с использованием вероятности , связанную с текущими значениями независимых переменных . Таким образом, предельное изменение в журналах не обязательно является постоянным: оно зависит от вероятностей всех других категорий, а не только от вероятности рассматриваемой категории (категория ). X j Y i X j X iβj(i)XjYiXjXi

Когда есть только категории, это должно сводиться к обычной логистической регрессии. Действительно, взвешивание вероятности ничего не делает и (выбирая ) дает просто разницу . Если в качестве базового случая категорию то это уменьшится до , потому что мы принудительно . Таким образом, новая интерпретация обобщает старое.i = 2 β ( 2 ) j - β ( 1 ) j i β ( 2 ) j β ( 1 ) j = 0k=2i=2βj(2)βj(1)iβj(2)βj(1)=0

Чтобы интерпретировать напрямую, мы выделим его с одной стороны предыдущей формулы, что приведет к:βj(i)

Коэффициент для категории равна предельным изменение в журнале шансы категории по отношению к переменной , плюс вероятность-взвешенное среднее коэффициентов всех остальных для категории . i i X j X j iXjiiXjXji

Другая интерпретация, хотя и немного менее прямая, обеспечивается (временно) установкой категории в качестве базового случая, в результате чего для всех независимых переменных :β ( i ) j = 0 X jiβj(i)=0Xj

Предельная скорость изменения логарифмов базового случая для переменной является отрицательной величиной взвешенного по вероятности среднего ее коэффициентов для всех других случаев.Xj

На самом деле использование этих интерпретаций обычно требует извлечения бета-версий и вероятностей из программного обеспечения и выполнения вычислений, как показано.

Наконец, для возведенных в степень коэффициентов отметим, что отношение вероятностей между двумя исходами (иногда называемое «относительным риском» по сравнению с )я 'ii

YiYi=pi(X,β)pi(X,β).

Давайте увеличим на одну единицу до . Это умножает на и на , откуда относительный риск умножается на = . Принятие категории в качестве базового случая приводит к уменьшению этого значения до , что заставляет нас сказать,X j + 1 p i exp ( β ( i ) j ) p i ' exp ( β ( i ' ) j ) exp ( β ( i ) j ) / exp ( β ( i ' ) j ) exp ( β ( i ) j - β ( i ) jXjXj+1piexp(βj(i))piexp(βj(i))exp(βj(i))/exp(βj(i))exp(βj(i)βj(i))iexp(βj(i))

Экспоненцируется коэффициент является величина , на которую относительный риск является умноженный когда переменная увеличивается на одну единицу.exp(βj(i))Pr[Y=category i]/Pr[Y=base category]Xj


1
Великолепные объяснения, но ОП явно просили полиномиальную модель. Возможно, я больше разбираюсь в вопросе, чем предполагалось в ОП, и объяснение двоичного случая может быть адекватным, но я бы хотел, чтобы этот ответ также охватывал общий полиномиальный случай. Несмотря на то, что параметризация аналогична, «log-odds» в общем случае относятся к (произвольной) ссылочной категории, и они на самом деле не являются log-odds, и единичное изменение в приводит к комбинированному изменению этих «log -odds ", а увеличение" log-odds "не подразумевает и увеличения вероятности. Xi
NRH

@NRH Это отличный момент. Я как-то читал «многовариантный» вместо «многочленный». Если мне удастся вернуться к этому, я постараюсь уточнить эти детали. К счастью, тот же метод анализа эффективен при поиске правильной интерпретации.
whuber

@NRH Готово. Я приветствую ваши предложения (или чьи-либо еще) о том, как сделать интерпретацию более понятной или для альтернативных интерпретаций.
whuber

1
спасибо, что записали это. Полный ответ - очень хорошая ссылка.
NRH

1

Попробуйте рассмотреть это немного объяснения в дополнение к тому, что @whuber уже так хорошо написал. Если exp (B) = 6, то отношение шансов, связанных с увеличением на 1 для рассматриваемого предиктора, равно 6. В полиномиальном контексте под «отношением шансов» мы подразумеваем отношение этих двух величин: а) шансы ( не вероятность, а скорее p / [1-p]) случая, принимающего значение зависимой переменной, указанной в рассматриваемой выходной таблице, и b) шансы случая, принимающего эталонное значение зависимой переменной.

Похоже, вы пытаетесь количественно оценить вероятность, а не шансы того, что дело относится к той или иной категории. Чтобы сделать это, вам нужно знать, с каких вероятностей «начался» случай, т. Е. До того, как мы предположили увеличение на 1 для рассматриваемого предиктора. Отношения вероятностей будут варьироваться от случая к случаю, в то время как отношение шансов, связанных с увеличением на 1 на предикторе, остается неизменным.


«Если exp (B) = 6, то отношение шансов, связанных с увеличением на 1 для рассматриваемого предиктора, равно 6», если я правильно прочитал ответ @ whuber, то это говорит о том, что отношение шансов будет умножено на 6 с увеличением 1 на предиктор. То есть новый коэффициент шансов не будет равен 6. Или я неправильно истолковываю вещи?
2016 г.

Там, где вы говорите: «Новое соотношение шансов не будет 6», я бы сказал, что «Новое соотношение шансов не будет 6 ... но отношение новых к старым коэффициентам будет 6».
rolando2

Да, я согласен с этим! Но я просто подумал, что «отношение шансов, связанных с увеличением на 1 для рассматриваемого предиктора, равным 6», на самом деле не говорит об этом. Но, может быть, я тогда просто неверно истолковал это. Благодарю за разъяснение!
2016 г.

1

Я также искал тот же ответ, но то, что было выше, меня не удовлетворяло. Казалось сложным для того, что это на самом деле. Поэтому я дам свою интерпретацию, пожалуйста, поправьте меня, если я ошибаюсь.

Однако прочитайте до конца, так как это важно.

Прежде всего, значения B и Exp (B) - это то, что вы ищете. Если B отрицателен, ваш Exp (B) будет меньше единицы, что означает уменьшение шансов. Если выше значение Exp (B) будет больше 1, что означает увеличение шансов. Так как вы умножаете на коэффициент Exp (B).

К сожалению, вы еще не там. Поскольку в полиноминальной регрессии ваша зависимая переменная имеет несколько категорий, давайте назовем эти категории D1, D2 и D3. Из которых ваш последний является справочной категорией. И давайте предположим, что вашей первой независимой переменной является пол (мужчины против женщин).

Допустим, выход для мужчин D1 -> равен exp (B) = 1,21, это означает, что для мужчин шансы увеличиваются в 1,21 раза для категории D1, а не для D3 (контрольная категория) по сравнению с женщинами (контрольная категория).

Таким образом, вы всегда сравниваете с вашей справочной категорией зависимых, но также и независимых переменных. Это не так, если у вас есть ковариатическая переменная. В этом случае это будет означать; увеличение Х на одну единицу увеличивает шансы в 1,21 раза на категории D1, а не D3.

Для тех с порядковой зависимой переменной:

Если у вас есть порядковая зависимая переменная и вы не сделали порядковую регрессию, например, из-за предположения о пропорциональных коэффициентах. Имейте в виду, что ваша высшая категория - это справочная категория. Ваш результат, как указано выше, действителен для отчета. Но имейте в виду, что увеличение шансов на самом деле означает увеличение шансов быть в более низкой категории, а не в более высокой! Но это только если у вас есть порядковая зависимая переменная.

Если вы хотите узнать увеличение в процентах, возьмите фиктивное число шансов, скажем, 100, и умножьте его на 1,21, что на 121? По сравнению с 100, насколько это изменилось в процентном отношении?


0

Скажите, что exp (b) в млогите - 1.04. если вы умножаете число на 1,04, то оно увеличивается на 4%. Это относительный риск быть в категории а вместо б. Я подозреваю, что часть этой путаницы здесь может быть связана с 4% (мультипликативное значение) и 4% (аддитивное значение). % Интерпретация верна, если мы говорим об изменении процента, а не об изменении процентного пункта. (Последнее не имеет смысла, так как относительные риски не выражены в процентах.)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.