Итак, я только начинаю изучать, как нейронная сеть может работать для распознавания шаблонов и категоризации входных данных, и я видела, как искусственная нейронная сеть может анализировать данные изображений и классифицировать изображения ( демонстрация с convnetjs ), и ключ к этому является уменьшение изображения, и каждый пиксель стимулирует один входной нейрон в сеть.
Тем не менее, я пытаюсь обернуть голову вокруг, если это возможно сделать с помощью строковых входов? У меня есть сценарий использования «рекомендательного механизма» для фильмов, которые просмотрел пользователь. Фильмы содержат много строковых данных (заголовок, сюжет, теги), и я мог бы представить, что текст будет сокращен до нескольких ключевых слов, которые описывают этот фильм, но даже если я проанализирую пять лучших слов, которые описывают этот фильм, я думаете, мне нужны входные нейроны для каждого английского слова, чтобы сравнить набор фильмов? Я мог бы ограничить входные нейроны только словами, используемыми в наборе, но мог ли он расти / учиться, добавляя новые фильмы (пользователь смотрит новый фильм с новыми словами)? Большинство библиотек, которые я видел, не позволяют добавлять новые нейроны после обучения системы?
Существует ли стандартный способ сопоставления данных строки / слова / символа со входами в нейронную сеть? Или нейронная сеть на самом деле не является подходящим инструментом для разбора строковых данных, подобных этому (что является лучшим инструментом для сопоставления с образцом в строковых данных)?