Я хотел бы использовать неатомарные данные, как функцию для прогноза. Предположим, у меня есть таблица с этими функциями:
- Column 1: Categorical - House
- Column 2: Numerical - 23.22
- Column 3: A Vector - [ 12, 22, 32 ]
- Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [ Boolean, Categorical ] ]
- Column 5: A List [ 122, Boolean ]
Я хотел бы предсказать / классифицировать, например, столбец 2.
Я делаю что-то, чтобы автоматически отвечать на вопросы, любые вопросы, такие как «Где родился Фу?» ...
Сначала я делаю запрос в поисковую систему, затем в результате получаю некоторые текстовые данные, затем делаю все, что нужно (разметка, выделение, разбор, разбиение ...)
Мой первый подход состоял в том, чтобы создать таблицу, в каждой строке которой есть строка текста и множество функций, таких как «Первое слово», «Тег первого слова», «Куски» и т. Д.
Но при таком подходе мне не хватает отношений между предложениями.
Я хотел бы знать, если есть алгоритм, который смотрит внутри древовидных структур (или векторов) и создает отношения и извлекает все, что имеет отношение к прогнозированию / классификации. Я предпочел бы знать о библиотеке, которая делает это, чем алгоритм, который я должен реализовать.