AUC не сравнивает классы реальные и предсказанные друг с другом. Это не смотрит на прогнозируемый класс, а на оценку прогноза или вероятность. Вы можете сделать прогнозирование класса, применяя отсечение к этому баллу, скажем, каждый образец, который получил оценку ниже 0,5, классифицируется как отрицательный. Но РПЦ приходит до того, как это произойдет. Это работает с оценками / классом вероятностей.
Он берет эти оценки и сортирует все образцы в соответствии с этой оценкой. Теперь, когда вы найдете положительный образец, ROC-кривая делает шаг вверх (вдоль оси Y). Всякий раз, когда вы найдете отрицательный образец, вы двигаетесь вправо (вдоль оси X). Если этот балл отличается для двух классов, положительные образцы идут первыми (обычно). Это означает, что вы делаете больше шагов, чем вправо. Далее по списку появятся отрицательные образцы, поэтому вы двигаетесь влево. Когда вы просматриваете весь список образцов, вы достигаете координаты (1,1), что соответствует 100% положительных и 100% отрицательных образцов.
Если результат отлично отделяет положительные от отрицательных образцов, вы перемещаетесь от (x = 0, y = 0) до (1,0), а затем оттуда к (1, 1). Итак, площадь под кривой равна 1.
Если ваша оценка имеет одинаковое распределение для положительной и отрицательной выборок, вероятности найти положительную или отрицательную выборку в отсортированном списке равны, и, следовательно, вероятности для перемещения вверх или влево на ROC-кривой равны. Вот почему вы двигаетесь по диагонали, потому что вы двигаетесь вверх и влево, вверх и влево и т. Д., Что дает значение AROC около 0,5.
В случае несбалансированного набора данных размер шага отличается. Таким образом, вы делаете меньшие шаги влево (если у вас больше отрицательных образцов). Вот почему оценка более или менее не зависит от дисбаланса.
Таким образом, с помощью кривой ROC вы можете визуализировать, как ваши выборки разделены, и область под кривой может быть очень хорошим показателем для измерения производительности алгоритма двоичной классификации или любой переменной, которая может использоваться для разделения классов.
На рисунке показаны одинаковые распределения с разными размерами выборки. Черная область показывает, где ожидаются ROC-кривые случайных смесей положительных и отрицательных образцов.