Я выполнил классификацию с использованием нескольких классификаторов для данных, помеченных для двух классов, и использовал пятикратную перекрестную проверку. Для каждого сгиба я вычислял tp, tn, fp и fn. Затем я рассчитал точность, точность, отзыв и F-показатель для каждого теста. Мой вопрос заключается в том, что, когда я хочу усреднить результаты, я взял среднее значение точности, но могу ли я также усреднить точность, вспомнить и F-показатель? Или это будет математически неправильно? PS Наборы данных, используемые в каждом сгибе, хорошо сбалансированы с точки зрения количества экземпляров на класс.
Спасибо.