Шаббычеф дал очень четкое объяснение с точки зрения сложности модели. Я попытаюсь понять эту проблему с другой точки зрения, если она может кому-нибудь помочь.
В основном мы хотим максимизировать маржу в SVC. То же самое в SVR, в то время как мы хотим максимизировать ошибку предсказания с определенной точностью для лучшего обобщения. Здесь, если мы минимизируем ошибку прогнозирования, а не максимизируем, результат прогнозирования для неизвестных данных с большей вероятностью будет переопределен. Давайте подумаем о «максимизации ошибки предсказания» в одномерном случае.e
В одномерном случае наша цель - максимизировать расстояния от всех точек до линии тренда пределах . Обратите внимание, что мы установили ограничение точности как чтобы мы могли максимизировать расстояние, а не минимизировать . Тогда давайте взглянем на очень простое уравнение расстояния от точки до прямой.(xi,yi)y=ωx+bee
|ωxi−yi+b|ω2+1−−−−−√
Прямо сейчас числитель ограничен . Чтобы максимизировать расстояние, мы пытаемся минимизировать .eω
Любой может легко расширить одномерный случай на N-мерный случай, поскольку уравнение расстояния всегда будет евклидовым расстоянием .
Кроме того, у нас может быть обзор проблемы оптимизации в SVR для сравнения [1].
с. т. { y i - < ω , x i > - b ≤ e < ω , x i > + b - y i ≥ e
min12||ω||2
s.t.{yi−<ω,xi>−b≤e<ω,xi>+b−yi≥e
Благодарю.
[1] Смола А. и Б. Шёлкопф. Учебник по поддержке векторной регрессии. Статистика и вычисления, вып. 14, № 3, август 2004 г., стр. 199–222.