Наборы эталонных данных для совместной фильтрации


9

Я хотел бы протестировать новый алгоритм совместной фильтрации . Типичный вариант использования - рекомендовать фильмы на основе предпочтений пользователей, похожих на конкретного пользователя.

Какие наборы эталонных данных часто используют исследователи для проверки своих алгоритмов? Я знаю, что в Computer Vision люди часто используют MNIST или CIFAR, но я не нашел подобных наборов данных для совместной фильтрации.


1
Вы смотрели на призовой набор данных Netflix? Да, конкурс давно закончился, и он был удален с официального сайта по причинам конфиденциальности. Вы все еще можете попробовать найти его в других местах.
Владислав Довгальец

Kaggle.com имеет кучу. Просто найдите «рекомендация в: наборе данных» или «рекомендация в: соревнование».
пробег 8

Ответы:


8

Очевидным ответом будет призовой набор данных Netflix, в нем много исследований, и большинство алгоритмов CF имеют известные оценки.

Существуют и другие доступные наборы данных, которые обычно используются в качестве эталонов:


1

У меня есть хранилище, которое может вам помочь.

https://github.com/ArthurFortes/Datasets-for-Recommneder-Systems/


3
Пожалуйста, не публикуйте только ссылки, ответы должны быть автономными. Я рекомендую отредактировать ваш ответ, чтобы добавить хотя бы немного информации, которую предоставляет ссылка, а затем предоставить ссылку для дальнейшего изучения.
Мефи
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.