У меня есть 12 положительных тренировочных наборов (раковые клетки, обработанные лекарствами с каждым из 12 различных механизмов действия). Для каждого из этих положительных обучающих наборов я хотел бы обучить машину опорных векторов, чтобы отличить ее от отрицательного набора равного размера, выбранного из эксперимента. Каждый набор имеет от 1000 до 6000 ячеек, и в каждой ячейке имеется 476 признаков (изображений), каждая из которых линейно масштабируется до [0, 1].
Я использую LIBSVM и ядро Gaussian RGB. Используя пятикратную перекрестную проверку, я выполнил поиск по сетке для log₂ C ∈ [-5, 15] и log₂ ɣ ∈ [-15, 3]. Результаты приведены ниже:
Я был разочарован тем, что нет единого набора параметров, которые дают высокую точность для всех 12 задач классификации. Я также был удивлен, что сетки обычно не показывают область высокой точности, окруженную более низкой точностью. Означает ли это, что мне нужно расширить пространство параметров поиска, или поиск по сетке указывает на то, что что-то не так?