Ответы:
Я бы предложил следующее теоретическое руководство. При использовании Gaussian RBF ядра, ваша отдаяся поверхность будет основана на сочетании колпаковых поверхностей с центром в каждом векторе поддержки. Ширина каждой колоколообразной поверхности будет обратно пропорциональна . Если эта ширина меньше минимального парного расстояния для ваших данных, у вас, по сути, есть переоснащение. Если эта ширина больше, чем максимальное парное расстояние для ваших данных, все ваши точки попадают в один класс, и у вас тоже не будет хорошей производительности. Таким образом, оптимальная ширина должна быть где-то между этими двумя крайностями.
Нет, это в основном зависит от данных. Поиск по сетке (по преобразованным по логу гиперпараметрам) - очень хороший метод, если у вас есть только небольшое количество гиперпараметров для настройки, но вы не делаете разрешение сетки слишком точным, или вы, вероятно, перегоните настройку критерий. Для проблем с большим количеством параметров ядра, я считаю, что симплекс-метод Nelder-Mead работает хорошо.
pair-wise distance for your data
= простое евклидово расстояние после масштабирования?