В продолжение моего предыдущего вопроса мне было интересно, существуют ли какие-либо библиотеки обнаружения речи. Под распознаванием речи я подразумеваю передачу в аудиобуфере и получение индекса того, где речь начинается и заканчивается. Так что, если у меня есть 10 секунд выборки звука на частоте 44 кГц, я бы ожидал массив чисел, таких как:
44000
88000
123000
190334
...
Это может указывать, например, на то, что речь начинается через одну секунду, а затем заканчивается в второй точке и т. Д.
Чего я не ищу, так это распознавания речи, которое выписывает текст из произнесенного слова. Это, к сожалению, то, что я вижу много, когда я гуглю «обнаружение речи».
Было бы замечательно, если бы библиотека была на C, C ++ или даже Objective-C, поскольку я пишу приложение для iPhone.
Благодарность!