Нам потребуется некоторое время, чтобы добраться до него, но в итоге, изменение в одну единицу в переменной, соответствующей B, умножит относительный риск результата (по сравнению с базовым результатом) на 6.012.
Можно выразить это как увеличение относительного риска на «5012%» , но это путающий и потенциально вводящий в заблуждение способ сделать это, потому что он предполагает, что мы должны думать об изменениях аддитивно, тогда как на самом деле многочленная логистическая модель настоятельно рекомендует нам мыслить мультипликативно. Модификатор «относительный» является существенным, поскольку изменение в переменной одновременно изменяет прогнозируемые вероятности всех результатов, а не только рассматриваемого, поэтому мы должны сравнивать вероятности (с помощью соотношений, а не разностей).
Остальная часть этого ответа развивает терминологию и интуицию, необходимые для правильной интерпретации этих утверждений.
Фон
Давайте начнем с обычной логистической регрессии, а затем перейдем к полиномиальному случаю.
Для зависимой (двоичной) переменной Y и независимых переменных Xi модель
Pr[Y=1]=exp(β1X1+⋯+βmXm)1+exp(β1X1+⋯+βmXm);
эквивалентно, предполагая, что ,0≠Pr[Y=1]≠1
log(ρ(X1,⋯,Xm))=logPr[Y=1]Pr[Y=0]=β1X1+⋯+βmXm.
(Это просто определяет , который является коэффициентом как функция .)X яρXi
Без потери общности индексируйте так, чтобы была переменной, а - «B» в вопросе (чтобы ). Исправление значений и варьирование на небольшое количество приводит кX m β m exp ( β m ) = 6,012 X i , 1 ≤ i < m X m δXiXmβmexp(βm)=6.012Xi,1≤i<mXmδ
log(ρ(⋯,Xm+δ))−log(ρ(⋯,Xm))=βmδ.
Таким образом, - это предельное изменение коэффициентов входа в систему по отношению к .х мβm Xm
Чтобы восстановить , очевидно, мы должны установить и степень левую часть:δ = 1exp(βm)δ=1
ехр( βм)= опыт( βм× 1 )= опыт( журнал( ρ ( ⋯ , Xм+ 1 ) ) - журнал( ρ ( ⋯ , Xм) ) )= ρ ( ⋯ , Xм+ 1 )ρ ( ⋯ , Xм),
Это показывает как отношение шансов для увеличения на одну единицу . Чтобы понять, что это может значить, составьте таблицу некоторых значений для диапазона начальных шансов, сильно округляя, чтобы выделить шаблоны:X mехр( βм)Xm
Starting odds Ending odds Starting Pr[Y=1] Ending Pr[Y=1]
0.0001 0.0006 0.0001 0.0006
0.001 0.006 0.001 0.006
0.01 0.06 0.01 0.057
0.1 0.6 0.091 0.38
1. 6. 0.5 0.9
10. 60. 0.91 1.
100. 600. 0.99 1.
Для действительно малых коэффициентов, которые соответствуют действительно малым вероятностям, эффект увеличения на одну единицу заключается в умножении коэффициентов или вероятности примерно на 6,012. Коэффициент мультипликации уменьшается по мере увеличения шансов (и вероятности) и практически исчезает, когда шансы превышают 10 (вероятность превышает 0,9).Xm
Что касается аддитивного изменения, то между вероятностью 0,0001 и 0,0006 (только 0,05%) нет большой разницы, а между 0,99 и 1 не существует большой разницы (только 1%). Наибольший аддитивный эффект возникает, когда коэффициент равен , где вероятность изменяется от 29% до 71%: изменение + 42%.1/6.012−−−−√∼0.408
мы видим, что если мы выражаем «риск» как отношение шансов, то = «B» имеет простую интерпретацию - отношение шансов равно для увеличения единицы в но когда мы выражаем риск в некоторых В другом способе, таком как изменение вероятностей, интерпретация требует осторожности для определения начальной вероятности.β m X mβmβmXm
Полиномиальная логистическая регрессия
(Это было добавлено для последующего редактирования.)
Признав ценность использования лог-шансов для выражения шансов, давайте перейдем к полиномиальному случаю. Теперь зависимая переменная может быть равна одной из категорий , проиндексированных с помощью . Относительная вероятность того, что она находится в категории естьk ≥ 2 i = 1 , 2 , … , k iYk≥2i=1,2,…,ki
Pr[Yi]∼exp(β(i)1X1+⋯+β(i)mXm)
с параметрами которые будут определены, и записью для . В качестве аббревиатуры напишем правое выражение как или, если и удалены из контекста, просто . Нормализация для суммирования всех этих относительных вероятностей в единицу дает Y i Pr [ Y = категория i ] p i ( X , β ) X β p iβ(i)jYiPr[Y=category i]pi(X,β)Xβpi
Pr[Yi]=pi(X,β)p1(X,β)+⋯+pm(X,β).
(Существует двусмысленность в параметрах: их слишком много. Традиционно для сравнения выбирают «базовую» категорию, и все ее коэффициенты устанавливаются равными нулю. Однако, хотя это необходимо для сообщения об уникальных оценках бета-версий, оно не нужно интерпретировать коэффициенты для поддержания симметрии -. то есть, чтобы избежать каких - либо искусственных различий между категориями - давайте не будем применять любое такое ограничение , если мы не должны).
Один из способов интерпретации этой модели - запросить предельную скорость изменения логарифмических коэффициентов для любой категории (скажем, категории ) по отношению к любой из независимых переменных (скажем, ). То есть, когда мы немного меняем , это вызывает изменение логарифмов . Нас интересует постоянная пропорциональности, связанная с этими двумя изменениями. Цепное правило исчисления вместе с небольшой алгеброй говорит нам, что скорость измененияX J X J Y яiXjXjYi
∂ log odds(Yi)∂ Xj=β(i)j−β(1)jp1+⋯+β(i−1)jpi−1+β(i+1)jpi+1+⋯+β(k)jpkp1+⋯+pi−1+pi+1+⋯+pk.
Это имеет относительно простую интерпретацию как коэффициент для в формуле для вероятности того, что находится в категории минус «корректировка». Корректировка - это взвешенное по вероятности среднее значение коэффициентов во всех других категориях . Веса вычисляются с использованием вероятности , связанную с текущими значениями независимых переменных . Таким образом, предельное изменение в журналах не обязательно является постоянным: оно зависит от вероятностей всех других категорий, а не только от вероятности рассматриваемой категории (категория ). X j Y i X j X iβ(i)jXjYiXjXi
Когда есть только категории, это должно сводиться к обычной логистической регрессии. Действительно, взвешивание вероятности ничего не делает и (выбирая ) дает просто разницу . Если в качестве базового случая категорию то это уменьшится до , потому что мы принудительно . Таким образом, новая интерпретация обобщает старое.i = 2 β ( 2 ) j - β ( 1 ) j i β ( 2 ) j β ( 1 ) j = 0k=2i=2β(2)j−β(1)jiβ(2)jβ(1)j=0
Чтобы интерпретировать напрямую, мы выделим его с одной стороны предыдущей формулы, что приведет к:β(i)j
Коэффициент для категории равна предельным изменение в журнале шансы категории по отношению к переменной , плюс вероятность-взвешенное среднее коэффициентов всех остальных для категории . i i X j X j ′ iXjiiXjXj′i
Другая интерпретация, хотя и немного менее прямая, обеспечивается (временно) установкой категории в качестве базового случая, в результате чего для всех независимых переменных :β ( i ) j = 0 X jiβ(i)j=0Xj
Предельная скорость изменения логарифмов базового случая для переменной является отрицательной величиной взвешенного по вероятности среднего ее коэффициентов для всех других случаев.Xj
На самом деле использование этих интерпретаций обычно требует извлечения бета-версий и вероятностей из программного обеспечения и выполнения вычислений, как показано.
Наконец, для возведенных в степень коэффициентов отметим, что отношение вероятностей между двумя исходами (иногда называемое «относительным риском» по сравнению с )я 'ii′
YiYi′=pi(X,β)pi′(X,β).
Давайте увеличим на одну единицу до . Это умножает на и на , откуда относительный риск умножается на = . Принятие категории в качестве базового случая приводит к уменьшению этого значения до , что заставляет нас сказать,X j + 1 p i exp ( β ( i ) j ) p i ' exp ( β ( i ' ) j ) exp ( β ( i ) j ) / exp ( β ( i ' ) j ) exp ( β ( i ) j - β ( i ′ ) jXjXj+1piexp(β(i)j)pi′exp(β(i′)j)exp(β(i)j)/exp(β(i′)j)exp(β(i)j−β(i′)j)i′exp(β(i)j)
Экспоненцируется коэффициент является величина , на которую относительный риск является умноженный когда переменная увеличивается на одну единицу.exp(β(i)j)Pr[Y=category i]/Pr[Y=base category]Xj