AbuShawar & Atwell заявляют:
Чатбот - это собеседник, который по очереди общается с пользователями на естественном языке. Различные чат-роботы или системы диалога между человеком и компьютером были разработаны с использованием речевого или текстового общения и применялись в различных областях, таких как: лингвистические исследования, обучение языкам, обслуживание клиентов, помощь веб-сайтов и для развлечения.
Их и другие документы передают некоторые из многих современных подходов к обучению чат-ботов на момент написания этой статьи.
Автоматическое извлечение данных об обучении чатбота из корпорации Natural Dialogue , Баян АбуШавар, Эрик Этвелл, 2016
Тем не менее, большинство чат-ботов ограничены знаниями, которые есть в их файлах вручную, и определенным естественным языком, на котором они пишутся или говорят. В этой статье представлена программа, разработанная нами для преобразования машиночитаемого текста (корпуса) в определенный формат чат-бота, который затем используется для переподготовки чат-бота и создания чата, который ближе к человеческому языку. Были использованы разные корпуса: диалоговые корпуса, такие как Британский национальный корпус английского языка (BNC); священная книга ислама Корана, которая представляет собой монологический корпус, в котором стих и следующий стих повернуты; и FAQ, где вопросы и ответы - пара ходов. Основной целью этого процесса автоматизации является создание различных прототипов чат-ботов, говорящих на разных языках на основе корпуса.
Контекстно-неопределенный выбор действий чатбота с помощью параметризованного обучения вспомогательному подкреплению , Чуандун Инь, Руи Чжан, Цзяньчжун Ци, Ю Сунь и Тенглун Тан, 2018 г.
Мы предлагаем чат-бот с учетом неопределенности контекста и модель обучения с подкреплением (RL) для обучения чат-бота. Предложенная модель получила название «Параметризованный вспомогательный асинхронный критический фактор» (PA4C). Мы используем имитатор пользователя для имитации неопределенности уверенности пользователей в контексте разговора. По сравнению с наивными подходами, основанными на правилах, наш чат-робот, обученный по модели PA4C, избегает ручного выбора действий и более устойчив к дисперсии высказываний пользователя. Модель PA4C оптимизирует традиционные модели RL с параметризацией действий и вспомогательными задачами для обучения чат-ботов, которые решают проблемы большого пространства действий и состояний с нулевой наградой. Мы оцениваем модель PA4C по обучению чат-бота для задач создания событий календаря.
Обучение по системе обучения с супервизией с использованием Chatbot Interaction , публикация заявки на патент США 0034828 A1, International Business Machines Corporation, Armonk, NY, US, 2019
Реализованный на компьютере способ, содержащий прием и анализ точки данных для определения параметров точки данных, генерирование тикета оповещения на основе анализа точки данных, передачу через чат-бота по меньшей мере некоторой информации, содержащейся в тикете оповещения, одному или больше пользователей, и классифицируют через чат-бота точку данных, которая привела к выдаче предупреждения, основываясь на поведении устройства, которое сгенерировало точку данных. Джонатан А. Cagadas, Александр Д. Льюитт, Саймон Д. Микульчик, Каран Шукла, Ли А. Уильямсон
Двухэтапное обучение и смешанное кодирование-декодирование для реализации генеративного чат-бота с небольшим корпусом диалога , Jintae Kim, Hyeon-Gu Lee, Harksoo Kim, Yeonsoo Lee, Young-Gil Kim, 2016
Генеративные модели чат-ботов, основанные на последовательных сетях, могут генерировать естественные диалогические взаимодействия, если в качестве обучающих данных используется огромный корпус диалога. Однако, за исключением нескольких языков, таких как английский и китайский, по-прежнему трудно собрать большой корпус для диалога. Чтобы решить эту проблему, мы предлагаем модель чат-бота, использующую сочетание слов и слогов в качестве единиц кодирования-декодирования. Кроме того, мы предлагаем двухэтапный метод обучения, включающий предварительную подготовку с использованием большого корпуса без диалогов и переподготовку с использованием небольшого корпуса диалога. В наших экспериментах было показано, что единицы смеси помогают уменьшить проблемы, связанные с отсутствием словарного запаса (OOV). Более того, двухэтапный метод обучения был эффективен для уменьшения грамматических и семантических ошибок в ответах, когда чат-бот обучался с использованием небольшого корпуса диалога (533,
Подмодульный выбор данных для целенаправленной подготовки чатбота на основе вложений предложений , Младен Димовски, Клавдиу Мусат, Владимир Илиевский, Андреа Хоссманн, Майкл Баэрисвиль, 2018
Системы понимания разговорного языка (SLU), такие как целевые чат-боты или личные помощники, полагаются на модуль начального понимания естественного языка (NLU) для определения цели и извлечения соответствующей информации из пользовательских запросов, которые они принимают в качестве входных данных. Системы SLU обычно помогают пользователям решать проблемы в относительно узких областях и требуют большого количества данных обучения внутри области. Это приводит к значительным проблемам с доступностью данных, которые препятствуют разработке успешных систем. Чтобы облегчить эту проблему, мы предлагаем метод отбора данных в режиме с низким уровнем данных, который позволяет нам тренироваться с меньшим количеством помеченных предложений, тем самым снижая затраты на метки. Мы предлагаем функцию ранжирования данных, основанную на субмодульности, предельный выигрыш в соотношении-штрафе, для выбора точек данных для маркировки, основываясь только на информации, извлеченной из пространства текстового встраивания. Мы показываем, что расстояния в пространстве внедрения являются жизнеспособным источником информации, которую можно использовать для выбора данных. Наш метод превосходит две известные методики активного обучения и обеспечивает экономически выгодное обучение в блоке NLU. Кроме того, предлагаемая нами методика выбора не требует переобучения модели между этапами отбора, что также делает ее экономически эффективной.