Проверьте раздел 2.3.2 этого документа Chapelle и Zien. У них есть хорошая эвристика, чтобы выбрать хороший диапазон поиска для ядра RBF и C для SVM. я цитируюσС
Чтобы определить правильные значения оставшихся свободных параметров (например, по CV), важно выполнить поиск по правильной шкале. Поэтому мы фиксируем значения по умолчанию для и σ, которые имеют правильный порядок величины. В задаче c- класса мы используем квантиль 1 / c парных расстояний D ρ i j всех точек данных по умолчанию для σ . Значением по умолчанию для C является инверсия эмпирической дисперсии s 2 в пространстве признаков, которую можно вычислить как s 2 = 1Сσс1 / сDρя жσСs2
изп×пядра матрицыК.s2= 1NΣяКя я- 1N2Σя , джКя жn × nК
После этого они используют кратные (например , для к ∈ { - 2 , . . . , 2 } ) значения по умолчанию в качестве диапазона поиска в сетке-поиск с помощью кросс-проверки. Это всегда работало очень хорошо для меня.2КK ∈ { - 2 , . , , , 2 }
Конечно, мы @ciri сказали, что нормализация данных и т. Д. Всегда хорошая идея.