Преобразование списка частичных рейтингов в глобальный рейтинг


13

Я работаю над чем-то вроде следующей проблемы. У меня есть куча пользователей и N книг. Каждый пользователь создает упорядоченный рейтинг всех книг, которые он прочитал (что, вероятно, является подмножеством из N книг), например, Книга 1> Книга 40> Книга 25.

Теперь я хочу превратить эти индивидуальные рейтинги пользователей в единый упорядоченный рейтинг всех книг.

Есть ли хорошие или стандартные подходы, чтобы попробовать? Пока что я думаю о моделях Брэдли-Терри, применяемых для парных сравнений, но мне интересно, есть ли что-нибудь еще.


2
Я думаю, вы столкнетесь с множеством проблем с редкостью, если только пользователи (по какой-то причине) не прочитают подобные книги. Но учитывая n человек и учитывая, что большинство людей читают относительно немного книг, в подавляющем большинстве пар будет только один человек, который будет сравнивать. (Среднее число было 6 на человека в год, см. Пью
Питер Флом - Восстановить Монику

2
(+1) raegtin, вы задаете интересные, интересные вопросы. Я увлекаюсь моделями BT, но, кажется, здесь немного. Вы знакомы с литературой по совместной фильтрации? Это не та же проблема, но некоторые концепции и методы могут быть заимствованы. Вопрос, оставленный здесь без ответа, состоит в том, почему нужно верить, что книги могут получить однозначный, четко определенный рейтинг в первую очередь. (Как бы вы справились с делом на двух пользователей, например, с двумя книгами?)
кардинал

@ Питер Флом: Правильно, большинство пар не имеют сравнений. Но я надеюсь, что это нормально, поскольку, если вы знаете, что A> B и B> C, то даже если A и C не сравниваются напрямую, вы можете вывести A> C.
raegtin

@cardinal: Да, модели BT кажутся здесь вынужденными, но это единственное, о чем я могу думать прямо сейчас. Я знаком с литературой по совместной фильтрации, но я не уверен, как это применимо здесь, так как мне нужны рейтинги, а не сходства. Это правда, что единый глобальный рейтинг не обязательно имеет смысл (например, имеет ли смысл сравнивать детские книги с книгами для взрослых? Художественная литература с художественной литературой?), Но практически он все еще полезен. «Лучшие из» списков книг всплывают все время :)
raegtin

Кроме того, меня не волнует близкое упорядочение (например, действительно ли книга с рейтингом № 1 действительно лучше, чем книга № 2), а скорее упорядочение в совокупности (например, я хочу, чтобы первые 10% книг в моем заказе были быть лучше, чем нижние 10% или средние 10%).
Рэгтин

Ответы:


2

Если вы заинтересованы в использовании (больше, чем в разработке), попробуйте нашу ранговую систему ранжирования.

Rankade бесплатен и прост в использовании, и он отличается от модели Брэдли-Терри и системы ранжирования Elo (вот сравнение ), потому что он может управлять матчами с 2+ фракциями (т.е. книгами, в вашем сценарии). Вставив ранжированные пользователем рейтинги (как совпадения между двумя или более книгами, с подробными итоговыми позициями, включая связи), вы получите единый упорядоченный рейтинг всех книг, которые вы ищете. В зависимости от ранжирования вы можете проверить эволюцию времени для рейтинга книг, статистику совпадений книг и многое другое.


1
Вы должны описать свой алгоритм, по крайней мере, в целом, как подход. И ссылка на статью, где это описано полностью. В противном случае ваш ответ может рассматриваться как просто реклама.
ttnphns

1
Я добавил ссылку для простого сравнения между ри и самой известной системой ранжирования. Первое утверждение гласит: если вы заинтересованы в использовании (больше, чем в разработке) , значит, оно предлагается в качестве решения проблемы (rankade имеет графический интерфейс, в то время как Bradley-Terry и Plackett-Luce требуется реализация), более путь для достижения запрошенного решения.
Томазо Нери

1

Модели ранжирования Plackett-Luce решают эту проблему и представляют собой метод, основанный на вероятности, при котором вероятность максимизируется с использованием подпрограммы максимизации-максимизации, которая аналогична максимизации ожидания, в том смысле, что они используют вспомогательную целевую функцию над функцией правдоподобия, которая является оптимизирован для обеспечения итеративной монотонной максимизации функции правдоподобия. (см. алгоритмы MM для моделей ранжирования Plackett-Luce Дэвида Хантера). Он также предоставляет код.

> =

Это идеально подходит для вашего набора данных:

Книга 1> Книга 40> Книга 25

Книга 40> Книга 30

Книга 25> Книга 17> Книга 11> Книга 3 и т. Д.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.