Ответы:
Определенно, похоже, были исследовательские проекты, включающие какую-либо форму анализа текста / поиска информации / и т.д. и StackExchange сайты.
Некоторые примеры, которые я смог найти через google / google scholar (вряд ли будет где-либо рядом с исчерпывающим списком):
В более общем смысле, системы автоматического ответа на вопросы, по-видимому, являются довольно активной областью исследований, а не тривиальной / «решенной» проблемой. StackExchange может быть одним из источников данных для таких систем, но есть и множество других источников данных (Wikipedia, Quora и т. Д.).
DuckDuckGo узнает ответы на технические вопросы от StackExchange. Введите технический вопрос, такой как «текущие проекты используют stackexchange», в DuckDuckGo, и он предоставит выделенное резюме ответа справа. И у утки есть открытый API для многих (более 100) источников данных, отвечающих на вопросы. Или вы можете перейти непосредственно к API стека обмена .
Проекты могут использовать данные из открытого API SE, если они соответствуют своему TOU . По сути, просто убедитесь, что ваши пользователи могут сказать, что данные поступили из Stack Exchange. Лицензия на авторское право может также ограничивать вашу способность изменять содержание текста, например, с помощью обобщенного обобщенного текста. Возможно, именно поэтому Duck.com просто выделяет ключевые слова.
Закон о правах на данные постоянно меняется, особенно когда речь идет о данных, которые вы отправили на сайт, и моделях машинного обучения, полученных на основе этих данных. Новые европейские правила в отношении данных и конфиденциальности позволяют загружать или удалять все данные, которые вы отправляете на сайт, такие как обмен стека.