При выполнении 5-кратной перекрестной проверки (например) обычно рассчитывают отдельную кривую ROC для каждой из 5-кратных и часто умножают среднюю кривую ROC на стандартное отклонение. девиация показано как толщина кривой.
Тем не менее, для перекрестной проверки LOO, когда в каждом сгибе имеется только один тестовый набор данных, не представляется разумным вычислять ROC-кривую для этого одного набора данных.
Я взял все свои точки тестовых данных (вместе с их отдельно вычисленными p-значениями) и объединил их в один большой набор для вычисления одной кривой ROC, но статистически ли это нужно делать кошернее?
Как правильно применять ROC-анализ, когда число точек данных в каждом сгибе равно единице (как в случае перекрестной проверки LOO)?