Поскольку в данном случае точность - это доля правильно классифицированных выборок, мы можем применить проверку гипотезы о системе двух пропорций.
Пусть р 1 и р 2 быть точность , полученные из классификаторов 1 и 2 соответственно, а п будет число выборок. Количество выборок, правильно классифицированных в классификаторах 1 и 2, равно x 1 и x 2 соответственно.p^1p^2nx1x2
p^1=x1/n,p^2=x2/n
Статистика теста определяется
Z=p^1−p^22p^(1−p^)/n−−−−−−−−−−√ где p^=(x1+x2)/2n
Мы намерены доказать, что общая точность классификатора 2, т. Е. , лучше точности классификатора 1, то есть p 1 . Это создает нашу гипотезу какp2p1
- H0:p1=p2 (нулевая гипотеза о том, что оба равны)
- Ha:p1<p2 (альтернативная гипотеза, утверждающая, что более новая гипотеза лучше существующей)
Область отклонения определяется как
Z<−zα(если истина отклонить и принять H a )H0Ha
где получается из стандартного нормального распределения, которое относится к уровню значимости, α . Например, z 0,5 = 1,645 для уровня значимости 5%. Это означает, что если соотношение Z < - 1,645 истинно, то мы можем сказать с 95% уровнем достоверности ( 1 - α ), что классификатор 2 является более точным, чем классификатор 1.zααz0.5=1.645Z<−1.6451−α
Ссылки:
- Р. Джонсон и Дж. Фрейнд, Вероятность и статистика Миллера и Фрейнда для инженеров, 8-е изд. Prentice Hall International, 2011. (первоисточник)
- Проверка гипотезы-краткой формулы Резюме . (Принято из [1])