Философский вопрос о логистической регрессии: почему не обучено оптимальное пороговое значение?


13

Обычно в логистической регрессии мы подбираем модель и получаем некоторые прогнозы на тренировочном наборе. Затем мы проводим перекрестную проверку этих прогнозов обучения (что-то вроде этого ) и определяем оптимальное пороговое значение на основе чего-то вроде кривой ROC.

Почему бы нам не включить перекрестную проверку порогового значения в реальную модель и не обучить все целиком?

Ответы:


19

Порог не учитывается в модели, поскольку логистическая регрессия не является классификатором (см. Почему логистическая регрессия не называется логистической классификацией? ). Это модель для оценки параметра p , который определяет поведение распределения Бернулли. То есть вы предполагаете, что распределением ответов, зависящим от ковариат, является Бернулли, и поэтому вы хотите оценить, как изменяется параметр, управляющий этой переменной, в зависимости от ковариат. Это только модель прямой вероятности . Конечно, впоследствии он может использоваться в качестве классификатора, а иногда и в определенных контекстах, но это все еще модель вероятности.


1
Хорошо, я понимаю эту часть теории (спасибо за это красноречивое объяснение!), Но почему мы не можем включить аспект классификации в модель? То есть, почему мы не можем найти р, затем найти порог и обучить все это сквозной, чтобы минимизировать некоторые потери?
StatsSorceress

4
Вы, конечно, могли бы ( ответ @ Sycorax говорит о такой возможности). Но поскольку это не то, чем является сам LR, а скорее какое-то специальное расширение, вам придется самостоятельно кодировать полную схему оптимизации. Отметим, кстати, что Фрэнк Харрелл указал, что этот процесс приведет к тому, что по многим стандартам можно считать моделью худшей.
gung - Восстановить Монику

1
Хм. Я прочитал принятый ответ в соответствующем вопросе здесь , и я согласен с ним в теории, но иногда в приложениях классификации машинного обучения мы не заботимся о типах относительной ошибки, мы просто заботимся о «правильной классификации». В таком случае, не могли бы вы тренироваться, как я описал?
StatsSorceress

4
Как я уже сказал, вы очень можете настроить свою собственную оптимизацию, которая будет обучать модель и одновременно выбирать порог. Вы просто должны сделать это сами, и, по большинству стандартов, окончательная модель, вероятно, будет беднее.
gung - Восстановить Монику

1
@StatsSorceress "... иногда в классификации машинного обучения ...". Там должно быть большой акцент на иногда . Трудно представить проект, в котором точность является правильным ответом. По моему опыту, это всегда связано с точностью и отзывом класса меньшинства.
Уэйн

14

Это потому, что оптимальный порог - это не только функция истинно положительной скорости (TPR), ложноположительной скорости (FPR), точности или чего-либо еще. Другим важным компонентом является стоимость и отдача от правильных и неправильных решений .

Если ваша цель - простуда, ваш ответ на положительный тест - назначить два аспирина, а стоимость истинного необработанного положительного результата - это ненужные два дня головных болей, тогда ваш порог оптимального решения (а не классификации!) Вполне отличается от того, если ваша цель - какое-то опасное для жизни заболевание, и вы принимаете решение (а) относительно простой процедуры, такой как аппендэктомия, или (б) серьезного вмешательства, такого как месяцы химиотерапии! И обратите внимание, что, хотя ваша целевая переменная может быть двоичной (больной / здоровый), ваши решения могут иметь больше значений (отправьте домой два приема аспирина / проведите больше тестов / поместите в больницу и немедленно наблюдайте / работайте).

Итог: если вы знаете свою структуру затрат и все различные решения, вы, безусловно, можете напрямую обучить систему поддержки принятия решений (DSS), которая включает вероятностную классификацию или прогноз. Я бы, однако, настоятельно утверждал, что дискретизация прогнозов или классификаций с помощью порогов не является правильным способом для этого.

Смотрите также мой ответ на более раннюю ветку "Порог вероятности классификации" . Или этот мой ответ . Или этот .


4

Если оставить в стороне философские проблемы, это вызовет вычислительные трудности.

Причина в том, что функции с непрерывным выводом относительно легко оптимизировать. Вы ищите направление, в котором функция увеличивается, и затем идете по этому пути. Если мы изменим нашу функцию потерь, чтобы включить шаг «отсечки», наш выход станет дискретным, и поэтому наша функция потерь также будет дискретной. Теперь, когда мы изменяем параметры нашей логистической функции «немного» и совместно изменяем значение отсечки «немного», наша потеря дает идентичное значение, и оптимизация становится трудной. Конечно, это не невозможно (есть целая область изучения дискретной оптимизации ), но непрерывная оптимизация безусловнопроще решить проблему при оптимизации многих параметров. Удобно, что после того, как логистическая модель была подобрана, поиск оптимального среза, хотя это все еще проблема дискретного вывода, теперь выполняется только по одной переменной, и мы можем просто выполнить поиск по сетке, или что-то подобное, что является полностью жизнеспособным по одной переменной.


3

Независимо от базовой модели, мы можем определить распределение выборки TPR и FPR на пороге. Это подразумевает, что мы можем характеризовать изменчивость TPR и FPR при некотором пороге, и мы можем вернуться к желаемому компромиссу частоты ошибок.

Кривая ROC немного обманчива, потому что единственное, что вы контролируете - это порог, однако на графике отображаются TPR и FPR, которые являются функциями порога. Более того, TPR и FPR являются статистикой , поэтому они подвержены капризам случайной выборки. Это подразумевает, что если бы вы повторили процедуру (скажем, путем перекрестной проверки), вы могли бы придумать другой FPR и TPR при некотором конкретном пороговом значении.

Однако, если мы можем оценить изменчивость в TPR и FPR, то повторение процедуры ROC не является необходимым. Мы просто выбираем такой порог, чтобы конечные точки доверительного интервала (с некоторой шириной) были приемлемыми. Таким образом, выберите модель так, чтобы FPR был правдоподобно ниже некоторого определенного исследователем максимума, и / или TPR был правдоподобно выше некоторого определенного исследователем минимума. Если ваша модель не может достичь ваших целей, вам придется построить лучшую модель.

Конечно, значения TPR и FPR, допустимые при вашем использовании, будут зависеть от контекста.

Для получения дополнительной информации см. Кривые ROC для непрерывных данных. Автор Wojtek J. Krzanowski и David J. Hand.


Это на самом деле не отвечает на мой вопрос, но это очень хорошее описание кривых ROC.
StatsSorceress

Каким образом это не отвечает на ваш вопрос? Какой у вас вопрос, если не спрашиваете о том, как выбрать порог для классификации?
Sycorax говорит восстановить Монику

2
Я не знаю ни одной статистической процедуры, которая работает таким образом. Почему это квадратное колесо хорошая идея? Какую проблему это решает?
Sycorax говорит восстановить Монику

1
«Как выбрать порог таким образом, чтобы сократить время обучения?» похоже, очень отличается от вопроса в вашем оригинальном сообщении.
Sycorax говорит восстановить Монику

1
Несмотря на это, я не вижу, как это экономит время. Построение кривой ROC - не самая дорогая часть оценки модели, поэтому перенос порогового значения на шаг оптимизации кажется случайным и ненужным.
Sycorax сообщает восстановить Монику

-2

Обычно в биомедицинских исследованиях мы не используем обучающий набор - мы просто применяем логистическую регрессию ко всему набору данных, чтобы увидеть, какие предикторы являются значительными факторами риска для результата, на который мы смотрим; или посмотреть на одного предиктора интереса, контролируя влияние других возможных предикторов на результат.
Я не совсем уверен, что вы подразумеваете под пороговыми значениями, но есть различные параметры, которые можно стремиться оптимизировать: AUC, предельные значения для дихотомии непрерывной переменной предиктора, положительные и отрицательные прогностические значения, доверительные интервалы и p-значения, ложноположительные и ложноотрицательные показатели. Логистическая регрессия рассматривает совокупность субъектов и оценивает силу и причинную направленность факторов риска, которые способствуют получению интереса в этой совокупности. Можно также «запустить все наоборот», так сказать, и определить риск исхода индивидуума с учетом факторов риска, которые есть у индивидуума. Логистическая регрессия назначает каждому человеку риск исхода, основываясь на их индивидуальных факторах риска, и по умолчанию это 0,5. Если предмет вероятность того, что результат (на основе всех данных и субъектов в вашей модели) равен 0,5 или выше, предсказывает, что он будет иметь результат; если ниже 0,5, то это предсказывает, что он не будет. Но вы можете отрегулировать этот уровень отсечки, например, чтобы отметить больше людей, которые могут быть подвержены риску получить результат, хотя и ценой большего количества ложных срабатываний, прогнозируемых моделью. Вы можете отрегулировать этот уровень отсечки, чтобы оптимизировать решения по скринингу, чтобы предсказать, например, каким людям будет рекомендовано дальнейшее медицинское наблюдение, например; и для построения вашей положительной прогностической ценности, отрицательной прогностической ценности, ложных отрицательных и ложных положительных оценок для скринингового теста на основе модели логистической регрессии. Вы можете разработать модель на половине своего набора данных и протестировать ее на другой половине, но вы не Это действительно необходимо (и это сократит ваши «тренировочные» данные вдвое и, таким образом, уменьшит способность находить значимых предикторов в модели). Так что да, вы можете «тренировать все до конца». Конечно, в биомедицинских исследованиях вы хотели бы проверить его на другой популяции, другой набор данных, прежде чем сказать, что ваши результаты могут быть обобщены для более широкой популяции. Другой подход заключается в использовании подхода типа начальной загрузки, при котором ваша модель запускается на подвыборке вашей изучаемой популяции, затем заменяет эти предметы обратно в пул и повторяется с другой выборкой много раз (обычно 1000 раз). Если вы получаете значимые результаты в установленное большинство времени (например, в 95% случаев), тогда ваша модель может считаться проверенной - по крайней мере, по вашим собственным данным. Но опять же, чем меньше популяция для исследования, на которой вы работаете, тем менее вероятно, что некоторые предикторы будут статистически значимыми факторами риска для результата. Это особенно верно для биомедицинских исследований с ограниченным числом участников.
Использование половины ваших данных для «обучения» вашей модели, а затем «проверка» ее на другой половине - ненужное бремя. Вы не делаете это для t-тестов или линейной регрессии, так зачем делать это в логистической регрессии? Максимум, что он сделает, это позволит вам сказать «да, это работает», но если вы используете свой полный набор данных, вы все равно это определите. Разбиение ваших данных на более мелкие наборы данных создает риск не обнаружить значительных факторов риска в исследуемой совокупности (ИЛИ проверяющей совокупности), когда они фактически присутствуют, из-за небольшого размера выборки, наличия слишком большого количества предикторов для размера исследования и возможности что ваш «проверочный образец» не покажет никаких ассоциаций просто случайно. Логика, лежащая в основе подхода «обучай, затем проверяй», заключается в том, что если факторы риска, которые вы считаете значительными, недостаточно сильны, тогда они не будут статистически значимыми при моделировании случайно выбранной половины ваших данных. Но эта случайно выбранная выборка может случайно не показать связь или потому, что она слишком мала, чтобы факторы риска были статистически значимыми. Но это величина факторов риска и их статистическая значимость, которые определяют их важность, и по этой причине лучше использовать ваш полный набор данных для построения вашей модели. Статистическая значимость станет менее значимой при меньших размерах выборки, как и в большинстве статистических тестов. Выполнение логистической регрессии - это искусство почти столько же, сколько статистическая наука. Существуют разные подходы к использованию и различные параметры для оптимизации в зависимости от дизайна вашего исследования. не быть статистически значимым при моделировании некоторой случайно выбранной половины ваших данных. Но эта случайно выбранная выборка может случайно не показать связь или потому, что она слишком мала, чтобы факторы риска были статистически значимыми. Но это величина факторов риска и их статистическая значимость, которые определяют их важность, и по этой причине лучше использовать ваш полный набор данных для построения вашей модели. Статистическая значимость станет менее значимой при меньших размерах выборки, как и в большинстве статистических тестов. Выполнение логистической регрессии - это искусство почти столько же, сколько статистическая наука. Существуют разные подходы к использованию и различные параметры для оптимизации в зависимости от дизайна вашего исследования. не быть статистически значимым при моделировании некоторой случайно выбранной половины ваших данных. Но эта случайно выбранная выборка может случайно не показать связь или потому, что она слишком мала, чтобы факторы риска были статистически значимыми. Но это величина факторов риска и их статистическая значимость, которые определяют их важность, и по этой причине лучше использовать ваш полный набор данных для построения вашей модели. Статистическая значимость станет менее значимой при меньших размерах выборки, как и в большинстве статистических тестов. Выполнение логистической регрессии - это искусство почти столько же, сколько статистическая наука. Существуют разные подходы к использованию и различные параметры для оптимизации в зависимости от дизайна вашего исследования. Но эта случайно выбранная выборка может случайно не показать связь или потому, что она слишком мала, чтобы факторы риска были статистически значимыми. Но это величина факторов риска и их статистическая значимость, которые определяют их важность, и по этой причине лучше использовать ваш полный набор данных для построения вашей модели. Статистическая значимость станет менее значимой при меньших размерах выборки, как и в большинстве статистических тестов. Выполнение логистической регрессии - это искусство почти столько же, сколько статистическая наука. Существуют разные подходы к использованию и различные параметры для оптимизации в зависимости от дизайна вашего исследования. Но эта случайно выбранная выборка может случайно не показать связь или потому, что она слишком мала, чтобы факторы риска были статистически значимыми. Но это величина факторов риска и их статистическая значимость, которые определяют их важность, и по этой причине лучше использовать ваш полный набор данных для построения вашей модели. Статистическая значимость станет менее значимой при меньших размерах выборки, как и в большинстве статистических тестов. Выполнение логистической регрессии - это искусство почти столько же, сколько статистическая наука. Существуют разные подходы к использованию и различные параметры для оптимизации в зависимости от дизайна вашего исследования. s величина факторов риска и их статистическая значимость, которые определяют их важность, и по этой причине лучше использовать ваш полный набор данных для построения вашей модели. Статистическая значимость станет менее значимой при меньших размерах выборки, как и в большинстве статистических тестов. Выполнение логистической регрессии - это искусство почти столько же, сколько статистическая наука. Существуют разные подходы к использованию и различные параметры для оптимизации в зависимости от дизайна вашего исследования. s величина факторов риска и их статистическая значимость, которые определяют их важность, и по этой причине лучше использовать ваш полный набор данных для построения вашей модели. Статистическая значимость станет менее значимой при меньших размерах выборки, как и в большинстве статистических тестов. Выполнение логистической регрессии - это искусство почти столько же, сколько статистическая наука. Существуют разные подходы к использованию и различные параметры для оптимизации в зависимости от дизайна вашего исследования.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.