Как создать рекомендательную систему, которая объединяет функции совместной фильтрации и контента?


10

Я создаю систему Рекомендора и хочу включить как рейтинги «похожих» пользователей, так и особенности предметов. Результатом является прогнозируемый рейтинг [0-1]. Я рассматриваю нейронную сеть (для начала).

Таким образом, входные данные представляют собой комбинацию характеристик предметов и рейтингов каждого пользователя. Для позиции A и пользователя 1 система может быть обучена на комбинированных данных A1. Это был бы один пример обучения.

Что если пользователь 1 также оценил фильм B? Тогда будут ли данные B1 также учебным примером? Есть ли проблема с повторением обучения с функциями пользователя 1 таким способом?

Есть ли у вас какие-либо предложения о том, как лучше подойти к проблеме?

Ответы:


11

Почему вы рассматриваете нейронную сеть, прежде чем полностью понять проблему?

Стандартные методы факторизации матрицы для совместной фильтрации позволяют легко использовать возможности контента. Пример того, как это можно сделать в байесовской настройке, приведен в документе «Спичечная коробка» .


6

Три статьи об интеграции матричной факторизации с функциями контента (здесь, в частности, тематическая модель):

  • Дипак Агарвал и Би-Чунг Чен. 2010. FLDA: матричная факторизация посредством скрытого распределения дирихле. В материалах третьей международной конференции ACM по веб-поиску и интеллектуальному анализу данных (WSDM '10). ACM, Нью-Йорк, Нью-Йорк, США, 91-100.
  • Ханхуай Шан и Ариндам Банерджи. 2010. Обобщенные вероятностные матричные факторизации для совместной фильтрации. В материалах Международной конференции IEEE 2010 года по интеллектуальному анализу данных (ICDM '10). IEEE Computer Society, Вашингтон, округ Колумбия, США, 1025-1030.
  • Чонг Ван и Дэвид М. Блей. 2011. Совместное тематическое моделирование для рекомендации научных статей. В материалах 17-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (KDD '11). ACM, Нью-Йорк, Нью-Йорк, США, 448-456.

Я также хотел бы рекламировать свою собственную запись в блоге, в которой немного обсуждается эта проблема: Тематические модели соответствуют моделям фактора Лантента.


3

Нет необходимости в нейросетевом подходе, коллаборативная фильтрация сама по себе является алгоритмом. Для вашей проблемы есть хорошее описание систем cf и recomender:

ml-class.org

(ищите XVI: Рекомендательные Системы). Это элегантно, просто, и если вы делаете это правильно (то есть используете векторизованную форму, быстрые минимизаторы и подготовленные градиенты), это может быть довольно быстро.


Я использовал этот подход, но он не использует возможности элементов. Я хотел бы также включить функции.
B 7
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.