На самом деле это относительно известная проблема в области машинного обучения. В 2006 году Netflix предложил 1 миллион долларов за алгоритм, который обеспечил наилучшее разумное улучшение их рекомендательной системы. Теория выигрышного решения кратко обсуждается в этом учебнике Caltech по вводному машинному обучению.
В основном был использован метод обучения ансамбля . В частности, был использован тип смешивания или укладки . Это нетривиально, но интуитивно понятно. Чтобы понять интуицию использования различных статистических подходов в гармонии, рассмотрим разные причины, по которым разные люди любят одни и те же фильмы: например, Джо может понравиться Topgun, потому что он любит боевики 80-х, а Джейн любит Topgun, потому что ей нравятся фильмы с саундтреками Кенни Логгинса. Таким образом, тот факт, что оба зрителя смотрели (и высоко оценили фильм), не обязательно означает, что им понравятся другие фильмы с высокой вероятностью. Алгоритм прогнозирования в идеале сможет учесть эти различия, по крайней мере, в некоторой степени.
Это может сделать решение довольно простым, но балансировка конкурирующих алгоритмов и расстановка приоритетов для наилучшего предположения для каждого случая определенно не просты. Тот факт, что Netflix предложил такую большую награду, должен сделать масштаб проблемы довольно очевидным.
Если вы только начинаете заниматься машинным обучением, ознакомьтесь с приведенными выше ресурсами в зависимости от уровня вашего интереса и математического образования. Таким образом, регрессия, вероятно, будет работать хорошо, но возможно значительно лучшая производительность.