Вопросы с тегом «cosine-similarity»

2
Является ли сходство косинусов идентичным l2-нормированному евклидову расстоянию?
Идентичный смысл, что он будет производить идентичные результаты для ранжирования сходства между вектором ¯u и набором векторами V . У меня есть модель векторного пространства, в которой в качестве параметров используется мера расстояния (евклидово расстояние, косинусное сходство) и метод нормализации (нет, l1, l2). Насколько я понимаю, результаты настроек [косинус, нет] …

4
Интерпретация отрицательного косинуса сходства
Мой вопрос может быть глупым. Поэтому я заранее извинюсь. Я пытался использовать модель GLOVE, предварительно подготовленную группой Stanford NLP ( ссылка ). Тем не менее, я заметил, что мои результаты сходства показали некоторые отрицательные числа. Это сразу же побудило меня взглянуть на файл словесных векторных данных. По-видимому, значения в словах …

1
Есть ли связь между косинусным сходством, корреляцией Пирсона и z-счетом?
Мне интересно, есть ли связь между этими тремя показателями. Похоже, я не могу установить связь между ними, ссылаясь на определения (возможно, потому что я новичок в этих определениях и с трудом понимаю их). Я знаю, что диапазон сходства косинусов может быть от 0 до 1, и что корреляция Пирсона может …

1
Автоматическое извлечение ключевых слов: использование косинусных сходств в качестве функций
У меня есть матрица термина документа , и теперь я хотел бы извлечь ключевые слова для каждого документа с помощью контролируемого метода обучения (SVM, Naive Bayes, ...). В этой модели я уже использую Tf-idf, тег Pos, ...MMM Но теперь я задаюсь вопросом о nexts. У меня есть матрица с косинусом …

1
Алгоритмы встраивания слов с точки зрения производительности
Я пытаюсь вставить примерно 60 миллионов фраз в векторное пространство , а затем вычислить косинусное сходство между ними. Я использовал sklearn CountVectorizerс пользовательской функцией токенизатора, которая создает униграммы и биграммы. Оказывается, чтобы получить осмысленное представление, мне нужно учесть огромное количество столбцов, линейных по количеству строк. Это приводит к невероятно редким …

3
K-среднее по косинусу сходства против евклидова расстояния (LSA)
Я использую скрытый семантический анализ для представления совокупности документов в пространстве меньшего размера. Я хочу сгруппировать эти документы в две группы с помощью k-средних. Несколько лет назад я сделал это с помощью gensim Python и написал свой собственный алгоритм k-средних. Я определил кластерные центроиды, используя евклидово расстояние, но затем сгруппировал …

2
Как изменяется косинусное сходство после линейного преобразования?
Есть ли математическая связь между: косинусное сходство двух векторов и , иA Bsim(A,B)sim⁡(A,B)\operatorname{sim}(A, B)AAABBB косинусное сходство для и , неравномерно масштабированное с помощью заданной матрицы ? Здесь - заданная диагональная матрица с неравными элементами на диагонали.A Bsim(MA,MB)sim⁡(MA,MB)\operatorname{sim}(MA, MB)AAABBBМMMMMMM Я попытался просмотреть вычисления, но не смог найти простую / интересную ссылку …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.