Для создания кривых ROC (= кривых рабочих характеристик приемника):
Предположим, у нас есть вероятностный двоичный классификатор, такой как логистическая регрессия. Прежде чем представить кривую ROC, необходимо понять концепцию матрицы смешения . Когда мы делаем бинарный прогноз, может быть 4 типа ошибок:
- Мы предсказываем 0, в то время как у нас должен быть класс, фактически равный 0: это называется Истинным Отрицательным , то есть мы правильно предсказываем, что класс отрицательный (0). Например, антивирус не обнаружил безвредный файл как вирус.
- Мы предсказываем 0, в то время как у нас должен быть класс, фактически равный 1: это называется ложным отрицанием , то есть мы неправильно предсказываем, что класс отрицательный (0). Например, антивирус не смог обнаружить вирус.
- Мы предсказываем 1, в то время как у нас должен быть класс, фактически равный 0: это называется False Positive , то есть мы неправильно предсказываем, что класс положительный (1). Например, антивирус рассматривал безвредный файл как вирус.
- Мы предсказываем 1, в то время как у нас должен быть класс, фактически равный 1: это называется True Positive , т.е. мы правильно предсказываем, что класс положительный (1). Например, антивирус по праву обнаружил вирус.
Чтобы получить матрицу путаницы, мы просматриваем все прогнозы, сделанные моделью, и подсчитываем, сколько раз встречается каждый из этих 4 типов ошибок:
В этом примере матрицы путаницы среди 50 классифицированных точек данных 45 классифицированы правильно, а 5 неправильно классифицированы.
Поскольку для сравнения двух разных моделей зачастую удобнее иметь одну метрику, чем несколько, мы вычисляем две метрики из матрицы путаницы, которую мы позже объединяем в одну:
- TпTп+ FN
- FпFп+ TN
0,00 ; 0,01 , 0,02 , … , 1,00
На этом рисунке синяя область соответствует области под кривой рабочей характеристики приемника (AUROC). Пунктирной линией на диагонали мы представляем ROC-кривую случайного предиктора: она имеет AUROC 0,5. Случайный предиктор обычно используется в качестве базовой линии, чтобы увидеть, полезна ли модель.
Если вы хотите получить опыт из первых рук: