В случае 2-гипотезы матрица смешения обычно имеет вид:
| Declare H1 | Declare H0 |
|Is H1 | TP | FN |
|Is H0 | FP | TN |
где я использовал что-то похожее на вашу запись:
- TP = истинно положительный (объявите H1, если, по правде говоря, H1),
- FN = ложноотрицательный (объявите H0, если, по правде говоря, H1),
- FP = ложно-положительный
- TN = истинно отрицательный
Исходя из необработанных данных, значения в таблице обычно являются подсчетами для каждого вхождения в тестовых данных. Исходя из этого, вы сможете рассчитать необходимые вам количества.
редактировать
Обобщением для многоклассовых задач является суммирование по строкам / столбцам матрицы путаницы. Учитывая, что матрица ориентирована, как указано выше, т. Е. Что данная строка матрицы соответствует конкретному значению для «истины», имеем:
Precision i=Mii∑jMji
Recall i=Mii∑jMij
То есть точность - это доля событий, где мы правильно объявили
из всех случаев, когда алгоритм объявил . И наоборот, отзыв - это доля событий, где мы правильно объявили из всех случаев, когда истинным состоянием мира является .я я яiiii