Меня немного смущает разница между SVM и персептроном. Позвольте мне попытаться суммировать мое понимание здесь, и, пожалуйста, не стесняйтесь исправить, где я ошибаюсь, и заполнить то, что я пропустил.
Перцептрон не пытается оптимизировать разделение «расстояния». Пока он находит гиперплоскость, которая разделяет два набора, это хорошо. SVM, с другой стороны, пытается максимизировать «опорный вектор», то есть расстояние между двумя ближайшими противоположными точками выборки.
SVM обычно пытается использовать «функцию ядра» для проецирования точек выборки в пространство больших измерений, чтобы сделать их линейно разделимыми, в то время как персептрон предполагает, что точки выборки линейно разделимы.