Порог принятия решения создает компромисс между количеством прогнозируемых позитивов и количеством прогнозируемых негативов, поскольку тавтологически увеличение порога принятия решений приведет к уменьшению количества прогнозируемых позитивов и увеличению количества негативов, которые вы прогнозируете. ты предсказываешь.
Порог принятия решения не является гиперпараметром в смысле настройки модели, поскольку он не меняет гибкость модели.
То, как вы думаете о слове «настройка» в контексте порога принятия решения, отличается от того, как настраиваются гиперпараметры. Изменение C и других гиперпараметров модели меняет модель (например, коэффициенты логистической регрессии будут отличаться), в то время как настройка порога может сделать только две вещи: обмен TP на FN и FP на TN. Тем не менее, модель остается той же, потому что это не меняет коэффициенты. (То же самое верно для моделей, которые не имеют коэффициентов, таких как случайные леса: изменение порога ничего не меняет в деревьях.) Таким образом, в узком смысле, вы правы, находя лучший компромисс между ошибками это «настройка», но вы ошибаетесь, думая, что изменение порога связано с другими гиперпараметрами модели способом, который оптимизируетсяGridSearchCV
.
Иными словами, изменение порога принятия решения отражает ваш выбор относительно того, сколько ложных положительных и отрицательных отрицательных значений вы хотите иметь. Рассмотрим гипотетическое, что вы устанавливаете порог принятия решения на абсолютно неправдоподобное значение, такое как -1. Все вероятности неотрицательны, поэтому с этим порогом вы будете предсказывать «положительный» для каждого наблюдения. С определенной точки зрения, это здорово, потому что ваш ложноотрицательный коэффициент равен 0,0. Тем не менее, ваш уровень ложных срабатываний также находится на пределе 1,0, поэтому в этом смысле ваш выбор порога в -1 ужасен.
Идеально, конечно, иметь TPR 1,0, FPR 0,0 и FNR 0,0. Но это обычно невозможно в реальных приложениях, поэтому возникает вопрос: «Сколько FPR я готов принять за сколько TPR?» И это мотивация roc кривых.