На данный момент (2017) наиболее активным проектом с открытым исходным кодом, реализующим это, является Anystyle Parser (последняя версия 07-2016). Он может быть использован через веб-интерфейс, API или загружен как RubyGem.
Они прямо упоминают на своем веб-сайте, что реализация основана на ParsCit (последняя версия 2013?) И FreeCite (последняя фиксация 2009).
Также сформируйте их веб-сайт:
AnyStyle Parser использует мощную эвристику машинного обучения, основанную на условных случайных полях, которую каждый может обучить с помощью нашего встроенного редактора.
Это действительно классная функция, которая делает эту реализацию наиболее интересной (imho). Обучение кажется довольно простым, как объясняется в документации по API . Вы просто предоставляете некоторые исправленные вручную результаты и запускаете Anystyle.parser.train
команду. Я не уверен, что ParsCit и FreeCite также поддерживают это, но если они этого не делают, мне кажется, что это огромная разница в возможностях.