Мой вопрос может быть глупым. Поэтому я заранее извинюсь.
Я пытался использовать модель GLOVE, предварительно подготовленную группой Stanford NLP ( ссылка ). Тем не менее, я заметил, что мои результаты сходства показали некоторые отрицательные числа.
Это сразу же побудило меня взглянуть на файл словесных векторных данных. По-видимому, значения в словах векторов было разрешено быть отрицательными. Это объясняет, почему я увидел отрицательное косинусное сходство.
Я привык к понятию косинусного подобия частотных векторов, значения которых ограничены в [0, 1]. Я точно знаю, что скалярное произведение и функция косинуса могут быть положительными или отрицательными, в зависимости от угла между векторами. Но мне действительно трудно понять и интерпретировать это отрицательное косинусное сходство.
Например, если у меня есть пара слов, дающая сходство -0,1, они менее похожи, чем другая пара, чье сходство составляет 0,05? Как насчет сравнения сходства от -0,9 до 0,8?
Или я должен просто посмотреть на абсолютное значение минимальной разности углов от ? Абсолютное значение баллов?
Огромное спасибо.
An angular-type similarity coefficient between two vectors. It is like correlation, only without centering the vectors.
единственное различие между ними состоит в том, что в корреляционных отклонениях (моментах), которые умножаются перекрестно, они являются от среднего значения, в то время как в косинусах отклонения от первоначального 0, то есть они являются значениями, как они есть ,