порог расчета для минимального классификатора риска?


11

Предположим, что два класса и имеют атрибут и имеют распределение и . если мы имеем равный для следующей матрицы затрат:C1C2xN(0,0.5)N(1,0.5)P(C1)=P(C2)=0.5

L=[00.510]

почему x0<0.5 является порогом для классификатора минимального риска (стоимости)?

Это мой пример заметки, который я неправильно понимаю (т.е. как достигается этот порог?)

Редактировать 1: Я думаю, что для порогов отношения правдоподобия мы можем использовать P (C1) / P (C2).

Редактировать 2: я добавляю из Duda Book на Pattern немного текста о пороге. введите описание изображения здесь

Ответы:


4

Для матрицы затрат

L=[00.510]c1c2predictionc1c2truth

потеря прогнозирования класса когда истина - это класс составляет , а стоимость прогнозирования класса когда истина - это класс составляет . За правильные прогнозы плата не взимается, . Тогда условный риск для прогнозирования любого класса равенc 2 L 12 = 0,5 c 2 c 1 L 21 = 1 L 11 = L 22 = 0 R kc1c2L12=0.5c2c1L21=1L11=L22=0Rk

р(с1|Икс)знак равноL11Pr(с1|Икс)+L12Pr(с2|Икс)знак равноL12Pr(с2|Икс)р(с2|Икс)знак равноL22Pr(с2|Икс)+L21Pr(с1|Икс)знак равноL21Pr(с1|Икс)
Для см. эти примечания на стр. 15.

Чтобы минимизировать риск / убыток, вы прогнозируете если цена из-за ошибки при этом (это потеря неправильного прогноза, умноженная на последующую вероятность того, что прогноз неверен, ) меньше, чем стоимость ошибочного прогнозирования альтернативы,L 12 Pr ( c 2 | x )с1L12Pr(с2|Икс)

Pr(c2|x)Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0,51

L12Pr(с2|Икс)<L21Pr(с1|Икс)L12Pr(Икс|с2)Pr(с2)<L21Pr(Икс|с1)Pr(с1)L12Pr(с2)L21Pr(с1)<Pr(Икс|с1)Pr(Икс|с2)
где вторая строка использует правило Байеса . При равных априорных вероятностях вы получаете Pr(с2|Икс)αPr(Икс|с2)Pr(с2)Pr(с1)знак равноPr(с2)знак равно0,5
12<Pr(Икс|с1)Pr(Икс|с2)

поэтому вы решили классифицировать наблюдение как , если отношение правдоподобия превышает этот порог. Теперь мне неясно, хотели ли вы знать «наилучший порог» с точки зрения отношения правдоподобия или с точки зрения атрибута . Ответ меняется в зависимости от функции стоимости. Использование гауссиана в неравенстве с и , , x σ 1 = σ 2 = σ μ 1 = 0 μ 2 = 1 1с1Иксσ1знак равноσ2знак равноσμ1знак равно0μ2знак равно1

12<12πσехр[-12σ2(Икс-μ1)2]12πσехр[-12σ2(Икс-μ2)2]журнал(12)<журнал(12πσ)-12σ2(Икс-0)2-[журнал(12πσ)-12σ2(Икс-1)2]журнал(12)<-Икс22σ2+Икс22σ2-2Икс2σ2+12σ2Иксσ2<12σ2-журнал(12)Икс<12-журнал(12)σ2
поэтому порог предсказания в терминахИкспоиск может быть достигнут только в том случае, если потери от ложных прогнозов одинаковы, т.е. потому что только тогда вы можете иметь и вы получите .L12знак равноL21журнал(L12L21)знак равножурнал(1)знак равно0Икс0<12

Хороший ответ, но смутил меня! если вы хотите выбрать или , какой из них правильный? Икс0знак равно0,5Икс0<0,5
user153695

Таким образом, прямо на границе решения вы не можете точно сказать, должно ли наблюдение находиться в классе один или два (потому что оно точно на границе). Поэтому выбирая ли наблюдение должен быть в классе 1 , если или до вас. При достаточно больших выборках это должно произойти для очень небольшого количества наблюдений, поэтому на полях это будет иметь значение для вашего результата. Икс0знак равно0,5яИкс00,5Икс0<0,5
Энди

все мои проблемы, которые привели к награде, что мой проф. рассчитывается и не принимается см. мои правки, о которых идет речь, тонкий порог должен быть . Икс0<0,5Икс0знак равно0,5Икс0<0,5
user153695

возможно 0.5-ln :)
user153695

1
@ whuber спасибо, я полностью пропустил это, поэтому я начал с совершенно неправильного конца.
Энди
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.