Полевые машины факторизации


11

Кто-нибудь может объяснить, как машины факторизации с учетом специфики поля (FFM) сравниваются со стандартными машинами факторизации (FM)?

Стандарт: http://www.ismll.uni-hildesheim.de/pub/pdfs/Rendle2010FM.pdf

«Полевая информация»: http://www.csie.ntu.edu.tw/~r01922136/kaggle-2014-criteo.pdf

Ответы:


2

Кажется, вы просите описание высокого уровня. Если вы ссылаетесь на слайды, на которые есть ссылки в слайдах вашего исходного сообщения, то есть сравнение FM (слайд 11) и FFM (слайд 12).

В качестве быстрого примера, если вы узнаете о пользователях и фильмах, FM может иметь следующий фактор:

w_{user_1}*w_{movie_1}*... + w{user_1}*w_{genre_1}*...

МУФ будет иметь:

w_{user_1, movies}*w_{movie_1, users}*... + w{user_1, genres}*w_{genre_1, users}*...

Основное различие заключается в том , что в FM, то w_{user_1}коэффициент одинаков в обоих условиях - есть одно понятие пользователя. В ФФМ, вы узнаете отдельно w_{user_1}для каждого контекста, например , является ли он взаимодействовать с кино или жанров. Обратите внимание, что это не изучается отдельно для каждого конкретного фильма или жанра, но для фильмов и жанров в целом. То есть он отдельно изучает контекст пользователя для каждого типа взаимодействия.

Также отмечу , что w_{movie_1}пошло , w_{movie_1, users}поскольку этот термин взаимодействует с w_{user_1}, пользователем.


2

Предположим (до горячего кодирования) у вас есть предикторы / поля из набора (например, жанр фильма, пол пользователя и раса пользователя). Предположим далее, что каждый предиктор может принимать одно из значений . После горячего кодирования у вас будет новый набор двоичных объектов размера .ZzZkzXK:=zZkz

В модели со всеми взаимодействиями необходимо оценить матрицу коэффициентов взаимодействия , которая имеет уникальных члена.QK×(K+1)/2

Машина факторизации помещает структуру в матрицу и предполагает, что , где имеет размерность , а некоторое число, указанное пользователем. Оценим вместо .QQWTWWl×K1lKWQ

Поля известны структура факторизации машина делает ставку на , а также. Он разбивает на блоки на основе (исходные характеристики). Если обозначает блок , мы предполагаем , что приходит от блок , где имеет размерность . Как и в FM, мы оцениваем вместо .QQzqzi,zjzi,zjQqzi,zjzi,zjWjTWiWil×KWiQ

FM-разложение имеет параметров. «Сознание» FM имеетпараметры. Модель со всеми взаимодействиями имеет параметра. K × l K × l × | Z | К × ( К + 1 ) / 2QK×lK×l×|Z|K×(K+1)/2


1

У стандартных машин факторизации тоже есть поля. «Новизна» здесь, кажется, использование функций GBDT и применение трюков хэширования. Не большой эффект, что кажется: проверить диапазон минут производительности на последнем слайде.


По мнению авторов, для модели действительно существует характерная для поля характеристика, относящаяся к стандартной реализации, - говорится на форумах kaggle. Я просто не мог понять, что это значит и какая разница на самом деле.
B_Miner


Основываясь на слайде 14, кажется, что они основали свое решение на этом документе ( Ансамбль моделей совместной фильтрации и функций для прогнозирования рейтинга кликов ).
Эмре
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.