Давайте рассмотрим простой пример идентификации хорошего помидора из пула хороших + плохих помидоров. Допустим, количество хороших помидоров равно 100, а плохих помидоров - 1000, итого 1100. Теперь ваша задача - найти как можно больше хороших помидоров. Один из способов получить все хорошие помидоры - взять все 1100 помидоров. Но это ясно говорит о том, что вы не можете отличить б / н от плохого .
Итак, каков правильный способ дифференциации - нужно получить как можно больше хороших, выбирая очень мало плохих , поэтому нам нужно измерить что-то, что может сказать, сколько хороших мы выбрали, а также сказать, что плохие считают в Это. Показатель AUC дает больший вес, если он может выбрать больше хороших с несколькими плохими, как показано ниже. в котором говорится, насколько хорошо вы можете различать б / н, хорошее и плохое.
В примере вы можете заметить, что, собирая 70% хороших помидоров, черная кривая выбрала около 48% плохих (примеси), а синяя имеет 83% плохих (примеси). Таким образом, черная кривая имеет лучший показатель AUC по сравнению с синей.