Учитывая истинно положительные и ложно отрицательные показатели, вы можете рассчитать ложноположительные, истинно отрицательные?


24

У меня есть значения для True Positive (TP)и False Negative (FN)следующим образом:

TP = 0.25
FN = 0.75

Из этих значений мы можем рассчитать False Positive (FP)и True Negative (TN)?

Ответы:


53

В этой области довольно много терминологической путаницы. Лично мне всегда полезно возвращаться к матрице путаницы, чтобы подумать об этом. В тесте классификации / отбора вы можете столкнуться с четырьмя различными ситуациями:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

В этой таблице «истинно положительный», «ложно отрицательный», «ложно положительный» и «истинно отрицательный» являются событиями (или их вероятностью). Следовательно, то, что у вас есть, вероятно, является истинно положительным показателем и ложноотрицательным показателем . Различие имеет значение, потому что оно подчеркивает, что оба числа имеют числитель и знаменатель.

Там, где все немного запутано, вы можете найти несколько определений «ложноположительного показателя» и «ложноотрицательного показателя» с разными знаменателями.

Например, Википедия предоставляет следующие определения (они кажутся довольно стандартными):

  • Tпрзнак равноTп/(Tп+FN)
  • Fпрзнак равноFп/(Fп+TN)
  • TNрзнак равноTN/(Fп+TN)

Во всех случаях знаменателем является сумма столбца . Это также дает сигнал к их интерпретации: истинный положительный коэффициент - это вероятность того, что тест говорит «А», когда действительное значение действительно является А (т. Е. Это условная вероятность, обусловленная тем, что А является истинным). Это не говорит о том, насколько вероятно, что вы будете правы при вызове «А» (т. Е. Вероятность истинного положительного результата, обусловленного результатом теста «А»).

FNрзнак равно1-Tпр

Однако в литературе есть и другие определения. Например, Fleiss ( Статистические методы для норм и пропорций ) предлагает следующее:

  • «[…] Процент ложноположительных результатов […] - это доля людей среди тех, кто дал положительный ответ, которые на самом деле свободны от болезни».
  • «Ложно-отрицательный показатель […] - это доля людей среди отрицательно ответивших на тест, у которых, тем не менее, есть заболевание».

(Он также признает предыдущие определения, но считает их «расточительными из драгоценной терминологии» именно потому, что они напрямую связаны с чувствительностью и спецификой.)

Fпрзнак равноFп/(Tп+Fп)FNрзнак равноFN/(TN+FN)

Fleiss не использует и не определяет фразы «истинно отрицательный показатель» или «истинно положительный показатель», но если мы предположим, что это также условные вероятности с учетом конкретного результата / классификации теста, то ответ @ guill11aume является правильным.

В любом случае вам нужно быть осторожным с определениями, потому что нет однозначного ответа на ваш вопрос.


4
Очень хорошо (+1). Я сразу же ухватился за одну интерпретацию, но вы абсолютно правы, что альтернативное определение стандартно.
gui11aume

1
@ gui11aume. Благодарность! Это было мое чувство, но подумав об этом, я больше не уверен в этом. Глядя на ссылки, это может зависеть от области (машинное обучение против медицинского тестирования).
гала-концерт

Мой опыт показывает, что последнее определение, TPR = TP / (TP + FP), FPR = FP / (TP + FP) является более стандартным.
путешествующие

1
Вот публикация о различиях: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Обратите внимание на новую терминологию «Тестирование FPR» и «Предсказательный FPR»
бегущие

8

РЕДАКТИРОВАТЬ: см. Ответ Гаэль Лауран, который является более точным.

Если ваш истинный положительный показатель равен 0,25, это означает, что каждый раз, когда вы называете положительный результат, у вас есть вероятность 0,75 ошибиться. Это ваш ложный положительный рейтинг. Точно так же каждый раз, когда вы называете отрицательным, у вас есть вероятность 0,25 быть правым, что является вашим истинным отрицательным показателем.


Зависит от того, что вы пытаетесь охарактеризовать: тест в настройке на знание правды заранее или попытка принять решение о вероятности после теста только с учетом полученных результатов.
kd4ttc

3

Нет, если это имеет смысл, если «положительный» и «отрицательный» не имеют смысла для рассматриваемой проблемы. Я вижу много проблем, когда «положительный» и «отрицательный» - это произвольные принудительные выборы по порядковой или непрерывной переменной. FP, TP, sens, spec полезны только для феноменов «все или ничего».


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.