Эти термины часто встречаются вместе, но я хотел бы знать, как вы думаете, в чем различия, если таковые имеются.
Благодарность
Эти термины часто встречаются вместе, но я хотел бы знать, как вы думаете, в чем различия, если таковые имеются.
Благодарность
Ответы:
LSA и LSI в основном используются как синонимы, а информационное сообщество обычно называет их LSI. LSA / LSI использует SVD для разложения матрицы A терминальных документов на матрицу U концептуальных терминов, матрицу S сингулярных значений и матрицу V концептуальных документов в форме: A = USV '. Страница википедии содержит подробное описание скрытой семантической индексации .
В частности, в то время как LSA и LSI используют SVD для создания своей магии, существует вычислительно и концептуально более простой метод, называемый HAL (гиперпространственный аналог языка), который просматривает текст, отслеживая предшествующий и последующий контексты. Векторы извлекаются из этих (часто взвешенных) матриц совместного использования, и конкретные слова выбираются для индексации семантического пространства. Во многих отношениях мне дано понять, что он работает так же, как и LSA, не требуя математически / концептуально сложного шага SVD. См. Lund & Burgess, 1996 для подробностей.
NMF и SVD являются алгоритмами матричной факторизации. В Википедии есть некоторая соответствующая информация о NMF .
Другие респонденты покрыли LSI / LSA ...