Что кривые ROC говорят вам, что традиционный вывод не будет?


12

Когда вы будете склонны использовать кривые ROC над некоторыми другими тестами, чтобы определить прогнозирующую способность какого-либо измерения результата?

При работе с дискретными результатами (живыми / мертвыми, присутствующими / отсутствующими), что делает кривые ROC более или менее мощными, чем что-то вроде хи-квадрата?


Что такое кривая ROC? Не могли бы вы предоставить ссылку?

Ответы:


12

Функция ROC (это не обязательно кривая) позволяет оценить способность распознавания, обеспечиваемую конкретной статистической моделью (состоящей из предикторной переменной или их набора).

Основное соображение ROCs заключается в том, что предсказания модели не только вытекают из способности модели различать / делать предсказания на основе данных, представленных переменными предиктора. Также работает критерий ответа, который определяет, сколько доказательств необходимо для модели, чтобы предсказать ответ, и каков результат этих ответов. Значение, установленное для критериев ответа, будет сильно влиять на предсказания модели и, в конечном счете, на тип ошибок, которые она допустит.

Рассмотрим общую модель с переменными предиктора и критериями ответа. Эта модель пытается предсказать Присутствие X, отвечая Да или Нет. Итак, у вас есть следующая матрица путаницы:

                                **X present               X absent**
 **Model Predicts X Present**       Hit                   False Alarm

 **Model Predicts X Absent**      Miss                 Correct Rejection

В этой матрице вам нужно только учитывать соотношение ударов и ложных срабатываний (потому что остальные могут быть получены из них, учитывая, что они имеют от 1 до 1). Для каждого критерия ответа у вас будет другая матрица путаницы. Ошибки (пропуски и ложные тревоги) отрицательно связаны, что означает, что критерий ответа, который сводит к минимуму ложные тревоги, максимизирует пропуски и наоборот. Сообщение: нет бесплатного обеда.

Таким образом, чтобы понять, насколько хорошо модель распознает случаи / делает прогнозы, независимо от установленных критериев ответа, вы наносите на график показатели Hits и False, полученные по всему диапазону возможных критериев ответа.

На этом графике вы получаете функцию ROC. Область под функцией обеспечивает объективную и непараметрическую меру способности модели различать. Эта мера очень важна, потому что она свободна от каких-либо ошибок, которые могли быть вызваны критериями ответа.

Вторым важным аспектом является то, что, анализируя функцию, можно определить, какие критерии реагирования лучше подходят для ваших целей. Какие типы ошибок вы хотите избежать, и какие ошибки в порядке. Например, рассмотрим тест на ВИЧ: это тест, который ищет какие-то доказательства (в данном случае антитела) и делает дискриминацию / прогноз, основанный на сравнении данных с критерием ответа. Этот критерий ответа обычно устанавливается очень низким, чтобы вы минимизировали пропуски. Конечно, это приведет к большему количеству ложных тревог, которые имеют стоимость, но стоимость, которая незначительна по сравнению с пропусками.

С помощью ROC вы можете оценить способность некоторых моделей различать, независимо от критериев ответа, а также установить оптимальные критерии ответа, учитывая потребности и ограничения того, что вы измеряете. Такие тесты, как hi-square, не могут помочь в этом, потому что даже если ваши тесты, если прогнозы находятся на уровне шансов, много разных пар Hit-False Alarm соответствуют уровню шансов.

Некоторые структуры, такие как теория обнаружения сигналов, априори предполагают, что доказательства, доступные для дискриминации, имеют конкретное распределение (например, нормальное распределение или гамма-распределение). Когда эти предположения верны (или довольно близки), доступны некоторые действительно хорошие меры, которые облегчают вашу жизнь.

надеюсь, что это поможет вам понять преимущества РПЦ


1
Теперь у меня было 7 лет, чтобы подумать об этом и принять ваш ответ.
Jermdemo

6

Кривая ROC используется, когда предиктор непрерывен, а результат дискретен, поэтому критерий хи-квадрат неприменим. Фактически, ROC-анализ в некотором смысле эквивалентен критерию Манна-Уитни: площадь под кривой равна P (X> Y), то есть количеству, которое проверяется с помощью теста MW. Однако анализ Манна-Уитни не подчеркивает выбор отсечения, в то время как это является основным пунктом анализа ROC. Кроме того, кривые ROC часто используются как просто визуальное отображение прогнозирующей способности ковариаты.


6

Кратчайший ответ заключается в том, что традиционные тесты обнаружения сигнала дают вам только одну точку на ROC (характеристика работы приемника), в то время как кривая позволяет вам видеть отклики в диапазоне значений. Возможно, что критерии и d 'сдвигаются как единое целое по всей кривой. Это похоже на разницу между t-тестом, сгенерированным путем выбора двух классов переменных-предикторов, и двумя линиями регрессии, сгенерированными путем анализа параметрических манипуляций каждой переменной-предиктора.


2

В случае, если вы заинтересованы в дальнейших ссылках, обширный список статей доступен на веб-сайте К.Х. Зоу, « Литературные исследования характеристик работы приемника (ROC)» .

Кривые ROC также используются, когда кто-то заинтересован в сравнении характеристик различных классификаторов, с широким применением в биомедицинских исследованиях и биоинформатике.


1

Во многих отношениях ROC являются отклонением от основных инструментов вывода и оценки моделей. Я не вижу большой ценности там.


Пожалуйста, уточните, если у вас есть шанс! Я думаю, что у меня есть общее представление о вашем аргументе из других работ, и это было бы очень ценным дополнением здесь.
Мэтт Паркер

1
R2
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.