Что такое «ядро» в простом английском?


73

Есть несколько отличных способов использования:

  • оценка плотности ядра
  • трюк с ядром
  • сглаживание ядра

Пожалуйста, объясните, что «ядро» в них означает, простым языком, своими словами.


3
Не хамить, но разве это не тот вопрос, на который уже ответили до тошноты в Википедии и тому подобное? Google дал мне ответ в течение 15 секунд ...
Джорис Мейс

46
Я абсолютно ненавижу ответы Википедии за статистику. Есть бессвязные, символические беспорядки. Я ищу жемчужину ответа, которая может объяснить ответ на простом английском языке, так как я считаю, что это показывает более глубокий уровень понимания, чем математическое уравнение. Здесь есть много популярных «простых английских» вопросов, и на то есть веские причины.
Нил Макгиган

Ответы:


39

Как в статистике (оценка плотности ядра или сглаживание ядра), так и в литературе по машинному обучению (методы ядра) ядро ​​используется как мера сходства. В частности, функция ядра Определяет распределение сходств точек вокруг заданной точки . обозначает сходство точки с другой данной точкой .k(x,.)xk(x,y)xy


Это хороший способ выразить это. Мне интересно, можете ли вы обобщить это описание, чтобы оно также относилось к ядру «оценки плотности ядра».
Шаббычеф

2
В некотором смысле, да. Один из способов понять оценку плотности ядра состоит в том, что вы аппроксимируете плотность точки из некоторого распределения как средневзвешенное значение ее сходств с набором точек из распределения. Таким образом, понятие сходства играет здесь важную роль.
ebony1

1
Я понимаю, что «ядро» в статистике изначально заимствовано из жаргона, используемого при обсуждении интегральных уравнений.
Ник Кокс,

42

По-видимому, существует два разных значения «ядра»: одно чаще используется в статистике; другой в машинном обучении.

В статистике «ядро» наиболее часто используются для обозначения ядра оценки плотности и ядро сглаживания .

Прямое объяснение ядер в оценке плотности может быть найдено ( здесь ).

В машинном обучении «ядро» обычно используется для обозначения трюка ядра , метода использования линейного классификатора для решения нелинейной задачи «путем отображения исходных нелинейных наблюдений в многомерное пространство».

Простая визуализация могла бы состоять в том, чтобы представить, что весь класс находится в радиусе от начала координат в плоскости x, y (класс : ); и все класс находятся вне радиуса в этой плоскости (класс : ). Линейный разделитель невозможен, но, очевидно, круг с радиусом будет идеально разделять данные. Мы можем преобразовать данные в трехмерное пространство, вычислив три новые переменные , и0r0x2+y2<r21r1x2+y2>r2rx2y22xy, Два класса теперь будут разделяться плоскостью в этом трехмерном пространстве. Уравнение этой оптимально разделяющей гиперплоскости, где и равно , и в этом случае опускается . (Если окружность относительно начала координат, оптимальная разделяющая гиперплоскость также будет изменяться в .) Ядро - это функция отображения, которая вычисляет значение 2-мерных данных в 3-мерном пространстве.z1=x2,z2=y2z3=2xyz1+z2=1z3z3

В математике есть и другие применения «ядер» , но они, кажется, являются основными в статистике.


1
Очень хорошо! Я собираюсь использовать ваш пример с кружком для объяснения методов ядра, так как это лучшая визуализация, которую я встречал до сих пор. Спасибо!
Йорис Мейс

1
Следуя примеру Тилаколео, используя круг для объяснения трюка с ядром (у меня недостаточно репутации, чтобы добавить комментарий непосредственно к его ответу) Была ли в уравнении простая опечатка для разделяющей гиперплоскости? и это должно быть z1 + z2 = r ^ 2, а не z1 + z2 = 1? Или я неправильно понимаю? Я согласен, это хороший простой пример для иллюстрации концепции. Благодарю. Хотя определение z3 все еще кажется загадкой, но, очевидно, это не имеет значения для примера с центром в начале координат.
Алекс Блейкмор

Да, была опечатка. Спасибо за это Алекс. Я не всегда корректирую :-)
Thylacoleo

1
Следующее видео было предложено анонимным потенциальным редактором как «отличная визуализация того, что объяснил Тилаколео:» youtube.com/watch?v=3liCbRZPrZA
gung - Восстановить Монику

Используем ли мы внутренние продукты для отображения двумерных данных в трехмерные?
SmallChess
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.