K(x,x′)=ϕ(x)⋅ϕ(x′)ϕ(⋅) это функция, которая отображает входные векторы в пространстве признаков.
Так почему же ядро должно интерпретироваться как внутренний продукт в некотором функциональном пространстве? Причина заключается в том, что гораздо проще разработать теоретические границы производительности обобщений для линейных моделей (таких как логистическая регрессия), чем для нелинейных моделей (таких как нейронная сеть). Большинство линейных моделей можно записать так, чтобы входные векторы появлялись только в форме внутренних произведений. Это означает, что мы можем построить нелинейную модель, построив линейную модель в пространстве признаков ядра. Это фиксированное преобразование данных, поэтому все теоретические границы производительности для линейной модели автоматически применяются к новой нелинейной модели ядра *.
Важный момент, который поначалу трудно осознать, состоит в том, что мы склонны не думать о пространстве функций, которое было бы полезно для нашего конкретного приложения, а затем разрабатывать ядро, дающее начало этому пространству функций. В общем, мы придумали хорошую метрику подобия, а затем посмотрим, является ли она ядром (тест прост, если любая матрица попарных оценок функции ядра в точках общего положения положительно определена, то она является допустимым ядром) ,
∗