У меня есть задание по извлечению данных, где я создаю систему поиска изображений на основе контента. У меня 20 изображений 5 животных. Итак, всего 100 изображений.
Моя система возвращает 10 наиболее релевантных изображений для входного изображения. Теперь мне нужно оценить производительность моей системы с помощью кривой Precision-Recall. Однако я не понимаю концепцию кривой точности-отзыва. Допустим, моя система возвращает 10 изображений для изображения горилл, но только 4 из них - гориллы. Остальные 6 изображений возвращены другие животные. Таким образом,
- Точность есть
4/10 = 0.4
(релевантности возвращены) / (все возвращены) - отзыв
4/20 = 0.2
(релевантные возвращены) / (все релевантные)
Так что у меня есть только точка <0.2,0.4>
, а не кривая. Как у меня есть кривая (то есть набор точек)? Должен ли я изменить количество возвращаемых изображений (в моем случае это значение равно 10)?