Что происходит, когда мы обучаем линейный SVM нелинейно разделяемым данным?


11

Что происходит, когда мы обучаем базовую опорную векторную машину (линейное ядро ​​и отсутствие мягкого поля) на нелинейно разделимых данных? Задача оптимизации неосуществима, так что возвращает алгоритм минимизации?

Ответы:


11

Я думаю, что базовая опорная векторная машина означает жесткую маржу SVM. Итак, давайте рассмотрим:

Что такое Hard-Margin SVM

Короче говоря, мы хотим найти гиперплоскость с наибольшим запасом, которая была бы способна правильно разделить все наблюдения в нашем пространстве обучающей выборки.

Задача оптимизации в жестком марже SVM

Учитывая приведенное выше определение, какую проблему оптимизации мы должны решить?

  1. Самая большая маржа гиперплоскости: мы хотим max(margin)
  2. Уметь правильно разделять все наблюдения: нам нужно оптимизировать, marginа также удовлетворить ограничение: нет ошибок в выборке

Что происходит, когда мы обучаем линейный SVM нелинейно разделяемым данным?

Возвращаясь к вашему вопросу, поскольку вы упомянули, что набор обучающих данных не является линейно разделимым, при использовании SVM с жестким полем без преобразований функций невозможно найти какую-либо гиперплоскость, которая удовлетворяет «Нет ошибок в выборке» .

Обычно мы решаем задачу оптимизации SVM с помощью квадратичного программирования, потому что она может выполнять задачи оптимизации с ограничениями. Если вы используете Gradient Descent или другие алгоритмы оптимизации, которые не удовлетворяют ограничениям SVM с жестким запасом, вы все равно должны получить результат, но это не гиперплоскость SVM с жестким запасом.

Кстати, с нелинейно разделяемыми данными, обычно мы выбираем

  • жесткие поля SVM + преобразования функций
  • использовать SVM с мягким полем напрямую (на практике SVM с мягким полем обычно дает хорошие результаты)

спасибо за Ваш ответ. Таким образом, пакеты SVM, например, в R или Python, не используют методы квадратичного программирования, когда данные нелинейно разделимы?
SVM

Не уверен, какие библиотеки SVM вы используете. Я использую libsvm, и разные инструменты SVM могут использовать разные решатели SVM. Чтобы найти лучшие решатели SVM является еще одной темой исследования. QP является основным способом решения SVM.
Фансия
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.