Учитывая истинно положительные и ложно отрицательные показатели, вы можете рассчитать ложноположительные, истинно отрицательные?

24

У меня есть значения для True Positive (TP)и False Negative (FN)следующим образом:

TP = 0.25
FN = 0.75

Из этих значений мы можем рассчитать False Positive (FP)и True Negative (TN)?

roc confusion-matrix sensitivity-specificity

— Простота
источник

53

В этой области довольно много терминологической путаницы. Лично мне всегда полезно возвращаться к матрице путаницы, чтобы подумать об этом. В тесте классификации / отбора вы можете столкнуться с четырьмя различными ситуациями:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

В этой таблице «истинно положительный», «ложно отрицательный», «ложно положительный» и «истинно отрицательный» являются событиями (или их вероятностью). Следовательно, то, что у вас есть, вероятно, является истинно положительным показателем и ложноотрицательным показателем . Различие имеет значение, потому что оно подчеркивает, что оба числа имеют числитель и знаменатель.

Там, где все немного запутано, вы можете найти несколько определений «ложноположительного показателя» и «ложноотрицательного показателя» с разными знаменателями.

Например, Википедия предоставляет следующие определения (они кажутся довольно стандартными):

$TPR = TP/(TP + FN)$
$FPR = FP/(FP + TN)$
$TNR = TN/(FP + TN)$

Во всех случаях знаменателем является сумма столбца . Это также дает сигнал к их интерпретации: истинный положительный коэффициент - это вероятность того, что тест говорит «А», когда действительное значение действительно является А (т. Е. Это условная вероятность, обусловленная тем, что А является истинным). Это не говорит о том, насколько вероятно, что вы будете правы при вызове «А» (т. Е. Вероятность истинного положительного результата, обусловленного результатом теста «А»).

$FNR = 1 - TPR$

Однако в литературе есть и другие определения. Например, Fleiss ( Статистические методы для норм и пропорций ) предлагает следующее:

«[…] Процент ложноположительных результатов […] - это доля людей среди тех, кто дал положительный ответ, которые на самом деле свободны от болезни».
«Ложно-отрицательный показатель […] - это доля людей среди отрицательно ответивших на тест, у которых, тем не менее, есть заболевание».

(Он также признает предыдущие определения, но считает их «расточительными из драгоценной терминологии» именно потому, что они напрямую связаны с чувствительностью и спецификой.)

$FPR = FP / (TP + FP)$ $FNR = FN / (TN + FN)$

Fleiss не использует и не определяет фразы «истинно отрицательный показатель» или «истинно положительный показатель», но если мы предположим, что это также условные вероятности с учетом конкретного результата / классификации теста, то ответ @ guill11aume является правильным.

В любом случае вам нужно быть осторожным с определениями, потому что нет однозначного ответа на ваш вопрос.

— гала
источник

4

Очень хорошо (+1). Я сразу же ухватился за одну интерпретацию, но вы абсолютно правы, что альтернативное определение стандартно.

— gui11aume

1

@ gui11aume. Благодарность! Это было мое чувство, но подумав об этом, я больше не уверен в этом. Глядя на ссылки, это может зависеть от области (машинное обучение против медицинского тестирования).

— гала-концерт

Мой опыт показывает, что последнее определение, TPR = TP / (TP + FP), FPR = FP / (TP + FP) является более стандартным.

— путешествующие

1

Вот публикация о различиях: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Обратите внимание на новую терминологию «Тестирование FPR» и «Предсказательный FPR»

— бегущие

8

РЕДАКТИРОВАТЬ: см. Ответ Гаэль Лауран, который является более точным.

Если ваш истинный положительный показатель равен 0,25, это означает, что каждый раз, когда вы называете положительный результат, у вас есть вероятность 0,75 ошибиться. Это ваш ложный положительный рейтинг. Точно так же каждый раз, когда вы называете отрицательным, у вас есть вероятность 0,25 быть правым, что является вашим истинным отрицательным показателем.

— gui11aume
источник

Зависит от того, что вы пытаетесь охарактеризовать: тест в настройке на знание правды заранее или попытка принять решение о вероятности после теста только с учетом полученных результатов.

— kd4ttc

3

Нет, если это имеет смысл, если «положительный» и «отрицательный» не имеют смысла для рассматриваемой проблемы. Я вижу много проблем, когда «положительный» и «отрицательный» - это произвольные принудительные выборы по порядковой или непрерывной переменной. FP, TP, sens, spec полезны только для феноменов «все или ничего».

— Фрэнк Харрелл
источник

-2

http://www.statsdirect.com/help/default.htm#clinical_epidemiology/screening_test.htm

1) True + ve и false -ve составляют 100% 2) False + ve и true -ve составляют 100% 3) Нет никакой связи между истинными положительными и ложными положительными результатами.

— Sughosh
источник