Я работаю в проблемной области, где люди часто сообщают о ROC-AUC или AveP (средняя точность). Однако недавно я нашел бумаги, которые оптимизируют потерю журнала , в то время как другие сообщают о потере шарнира .
Хотя я понимаю, как рассчитываются эти показатели, мне трудно понять компромиссы между ними, и что хорошо для чего именно.
Когда речь идет о ROC-AUC против Precision-Recall, этот поток обсуждает, как максимизация ROC-AUC может рассматриваться как использование критериев оптимизации потерь, которые наказывают «ранжирование истинного отрицательного по меньшей мере такого же, как истинного положительного» (при условии, что более высокое баллы соответствуют позитивам). Кроме того, этот другой поток также предоставляет полезное обсуждение ROC-AUC в отличие от метрик Precision-Recall .
Тем не менее, для каких типов проблем предпочтение будет отдано потере бревна , скажем, ROC-AUC , AveP или потере шарнира ? Наиболее важно, какие типы вопросов следует задавать о проблеме при выборе между этими функциями потерь для двоичной классификации?