Я предлагаю посмотреть на это по-другому ...
В логистической регрессии мы предсказываем некоторый двоичный класс {0 или 1}, вычисляя вероятность правдоподобия, которая является фактическим выводом .logit(p)
Это, конечно, предполагает, что лог-шансы могут быть разумно описаны линейной функцией - например,β0+β1x1+β2x2+⋯
... Это большое предположение, и только иногда это верно. Если эти компоненты не имеют независимого, пропорционального влияния на коэффициенты входа, то лучше выбрать другую статистическую структуру. То есть log-odds состоит из некоторого фиксированного компонента и увеличивается с каждым последующим слагаемым .xiβ0βixi
Короче говоря, значение является «фиксированным компонентом» этого компонентного метода для описания лог-шансов любого события / условия, которое вы пытаетесь предсказать. Также помните, что регрессия в конечном итоге описывает некоторое условное среднее, учитывая набор значений . Ни одна из этих вещей не требует, чтобы значения равны 0 в ваших данных или даже возможны в реальности. просто смещается , что линейное выражение вверх или вниз так , что компоненты переменных являются наиболее точными.β0xixiβ0
Может быть, я сказал то же самое в несколько ином мышлении, но я надеюсь, что это поможет ...