Я пытаюсь понять, как вычислить оптимальную точку отсечения для кривой ROC (значение, при котором чувствительность и специфичность максимальны). Я использую набор данных aSAH
из пакета pROC
.
outcome
Переменная может быть объяснено двумя независимыми переменными: s100b
и ndka
. Используя синтаксис Epi
пакета, я создал две модели:
library(pROC)
library(Epi)
ROC(form=outcome~s100b, data=aSAH)
ROC(form=outcome~ndka, data=aSAH)
Вывод иллюстрируется на следующих двух графиках:
На первом графике ( s100b
) функция говорит, что оптимальная точка отсечения локализована на значении, соответствующем lr.eta=0.304
. Во втором графике ( ndka
) оптимальная точка отсечения локализована при соответствующем значении lr.eta=0.335
(в чем смысл lr.eta
). Мой первый вопрос:
- что соответствует
s100b
иndka
значения для указанныхlr.eta
значений (какова оптимальная точка отсечения с точки зренияs100b
иndka
)?
ВТОРОЙ ВОПРОС:
Теперь предположим, что я создаю модель с учетом обеих переменных:
ROC(form=outcome~ndka+s100b, data=aSAH)
Полученный график:
Я хочу знать, каковы значения ndka
AND, s100b
при которых чувствительность и специфичность максимизируются функцией. Другими словами: каковы значения ndka
и s100b
при которых мы имеем Se = 68,3% и Sp = 76,4% (значения, полученные из графика)?
Я предполагаю, что этот второй вопрос связан с анализом multiROC, но документация Epi
пакета не объясняет, как рассчитать оптимальную точку отсечения для обеих переменных, используемых в модели.
Мой вопрос очень похож на этот вопрос от reasearchGate , который говорит вкратце:
Определение порогового значения, которое представляет лучший компромисс между чувствительностью и специфичностью меры, является простым. Однако, для анализа многомерной кривой ROC, я отметил, что большинство исследователей сосредоточилось на алгоритмах для определения общей точности линейной комбинации нескольких показателей (переменных) в терминах AUC. [...]
Однако в этих методах не упоминается, как определить комбинацию показателей отсечки, связанных с несколькими показателями, которая дает лучшую диагностическую точность.
Возможное решение - это то, что предложил Шульц в своей статье , но из этой статьи я не могу понять, как вычислить оптимальную точку среза для многомерной кривой ROC.
Возможно, решение из Epi
пакета не является идеальным, поэтому любые другие полезные ссылки будут оценены.