Какие особенности обычно используются из деревьев разбора в процессе классификации в НЛП?

13

Я изучаю различные типы структур дерева разбора. Двумя широко известными структурами дерева разбора являются: а) дерево разбора на основе постоянных и б) основанные на зависимости структуры дерева разбора.

Я могу использовать генерацию обоих типов структур дерева разбора с помощью пакета Stanford NLP. Однако я не уверен, как использовать эти древовидные структуры для моей задачи классификации.

Например, если я хочу провести анализ настроений и хочу классифицировать текст на положительные и отрицательные классы, какие функции я могу извлечь из структур дерева разбора для моей задачи классификации?

— работает
источник

9

Используя дерево разбора, вы делите свое предложение на части. Предположим, что в примере анализа настроений вы можете использовать эти части, чтобы назначить положительное / отрицательное настроение каждой части, а затем принять совокупный эффект этих частей.

анализ настроений

Это изображение поможет вам понять больше. Первая половина имеет негативные настроения (в основном из-за слова «сухой»), но из-за слова «но» и использования слова «наслаждающийся» негативные настроения превращаются в позитивные.

Что касается их использования, вы можете просто сгенерировать представление вектора слов отдельных слов в предложении и использовать нейроны вместо родительских узлов. Каждый нейрон должен быть связан с другим нейроном через вес. Все листовые узлы будут словесно-векторными представлениями слов предложения. Верхний родительский нейрон (в данном случае верхний синий + символ) должен генерировать позитивные / негативные настроения в соответствии с предложением. Эту древовидную структуру можно обучать контролируемым образом.

Прочитайте эту статью для более глубокого понимания.

Изображение предоставлено: cs224.stanford.edu

— Azrael
источник

1

Я думаю, что зависимости могут быть использованы для повышения точности вашего классификатора настроений. Рассмотрим следующие примеры:

E1: Билл не ученый

и предположим, что маркер «ученый» имеет позитивные настроения в определенной области.

Зная зависимость отрицательная (ученый, нет), мы можем видеть, что приведенный выше пример имеет негативное отношение. Без знания этой зависимости мы, вероятно, классифицировали бы предложение как положительное.

Другие типы зависимостей можно использовать, вероятно, таким же образом, чтобы повысить точность классификаторов.

— Пасмод Тьюринг
источник