Тензоры в литературе по нейронным сетям: какое самое простое определение?


16

В литературе по нейронным сетям часто встречается слово «тензор».

Это отличается от вектора? А из матрицы? У вас есть конкретный пример, который разъясняет его определение?

Я немного запутался в его определении. Википедия не помогает, и иногда у меня складывается впечатление, что ее определение зависит от конкретной используемой среды машинного обучения (TensorFlow, Caffee, Theano).


Ответы:


11

Для целей анализа данных вы можете эффективно рассматривать их как массивы, возможно многомерные. Таким образом, они включают в себя скаляры, векторы, матрицы и все массивы более высокого порядка.

Точное математическое определение является более сложным. По сути, идея заключается в том, что тензоры преобразуют полилинейные функции в линейные функции. Смотрите (1) или (2) . (Мультилинейные функции - это функции, которые являются линейными в каждом из их компонентов, примером является детерминант, рассматриваемый как функция векторов столбцов.)

Одним из следствий этого математического свойства, определяющего тензоры, является то, что тензоры хорошо преобразуются по отношению к якобианам, которые кодируют преобразования из одной системы координат в другую. Вот почему в физике часто определяют определение тензора как «объект, который определенным образом трансформируется при изменении координат». Смотрите это видео, например, или это .

Если мы имеем дело с достаточно «хорошими» объектами (все производные, которые мы хотели бы существовать и четко определены), то все эти способы мышления о тензорах по существу эквивалентны. Обратите внимание, что первый способ думать о тензорах, которые я упомянул (многомерные массивы), игнорирует различие между ковариантными и контравариантными тензорами. (Различие заключается в том, как их коэффициенты изменяются при изменении базиса базового векторного пространства, то есть, по существу, между векторами строк и столбцов.) См. Эти другие вопросы StackExchange: (1) (2) (3) (4)

Для книги, используемой исследователями, изучающими применение тензоров в нейронных сетях (например, в Технионе в Израиле), есть Тензорные пространства Вольфганга Хакбуша и Численное исчисление . Я сам еще не читал его, хотя некоторые из последующих глав, кажется, используют продвинутую математику.


3
+1. Очень похожие: stats.stackexchange.com/a/198395/28666 . Мне кажется, что в машинном обучении тензоры - это просто массивы и не более того. В математике тензоры понимаются по-разному; и обычно слово «тензор» используется более узко, чем «элемент тензорного произведения». Смотрите связанный ответ.
говорит амеба, восстанови Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.