Ответы:
Если вы тестируете производительность модели (то есть не оптимизируете параметры), обычно вы суммируете матрицы путаницы. Представьте себе, что вы разбили свои данные на 10 различных сгибов или «тестовых» наборов. Вы тренируете свою модель на 9/10 сгибов, проверяете первый сгиб и получаете матрицу путаницы. Эта запутанная матрица представляет собой классификацию 1/10 данных. Вы повторяете анализ снова со следующим набором «тест» и получаете еще одну матрицу путаницы, представляющую еще 1/10 данных. Добавление новой матрицы путаницы к первой теперь составляет 20% ваших данных. Вы продолжаете, пока не выполните все свои сгибы, суммируете все свои матрицы путаницы, и окончательная матрица путаницы представляет производительность этой модели для всех данных., Вы могли бы усреднить матрицы путаницы, но это не дает никакой дополнительной информации из совокупной матрицы и может быть предвзятым, если ваши сгибы не все одинакового размера.
Примечание. Это предполагает не повторную выборку ваших данных. Я не совсем уверен, если это будет отличаться для повторной выборки. Будет ли обновление, если я узнаю что-то или кто-то рекомендует метод.