Я создаю простой чат-бот. Я хочу получить информацию из ответа пользователя. Пример сценария:
Bot : Hi, what is your name?
User: My name is Edwin.
Я хочу извлечь имя Эдвин из предложения. Тем не менее, пользователь может ответить по-разному, например,
User: Edwin is my name.
User: I am Edwin.
User: Edwin.
Я пытался положиться на отношения зависимости между словами, но результат не очень хорошо.
Есть идеи о том, какую технику я мог бы использовать для решения этой проблемы?
[ОБНОВЛЕНО]
Я тестировал распознавание именованных объектов вместе с частью речевого тега и анализатора. Я обнаружил, что большинство моделей обучаются таким образом, что первый символ сущности для имени человека или имени существительного должен быть в верхнем регистре. Это может быть верно для обычного документа, но это не имеет значения для чат-бота. Например
User: my name is edwin.
Большинство NER не смогли распознать это.