Вопросы с тегом «information-retrieval»

11
Каков наилучший способ вычисления популярных тем или тегов?
Многие сайты предлагают некоторую статистику, например «Самые горячие темы за последние 24 часа». Например, Topix.com показывает это в разделе «Тенденции новостей». Там вы можете увидеть темы, которые имеют наиболее быстро растущее число упоминаний. Я хочу вычислить такой "шум" и для темы. Как я мог это сделать? Алгоритм должен взвешивать темы, …

6
Python: tf-idf-cosine: найти сходство документа
Я следил за учебником, который был доступен в частях 1 и 2 . К сожалению, у автора не было времени на последний раздел, в котором использовалось косинусное сходство, чтобы на самом деле найти расстояние между двумя документами. Я следил за примерами в статье с помощью следующей ссылки из stackoverflow , …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.