Конвертировать речь (аудиофайлы в формате mp3) в текст


8

Я ищу простой конвертер из mp3 в TXT. Я безуспешно пытался: julius, CMU Sphinx, ... За последние 4 часа я не нашел способа как их использовать (или правильно установить).

Я ищу что-то вроде:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

Я также в порядке с приложением GUI, так как у меня есть только несколько файлов для конвертации и могу кликать.

Редактировать: С помощью этого ответа приложение распознавания речи для преобразования MP3 в текст? Мне удалось заставить это работать, но это не производит выходной. Ну, на самом деле он производит пару пустых строк (слова не обнаружены) ...


Какую команду вы выполняете и какой вывод видите?
Николай Шмырев

1
$ pocketsphinx_continuous -infile 1.wav -hmm en-us / cmusphinx-en-us-5.2 -lm en-us / en-70k-0.2.lm -logfn / dev / null &> otput.txt является точной командой согласно @NikolayShmyrev вопрос. Я скачал модели с sourceforge.net/projects/cmusphinx/files/… .
Само

Ответы:


4

pocketsphinx будет выполнять речь к тексту из существующего аудиофайла. В зависимости от исходного формата mp3 вам могут понадобиться две отдельные команды.

Сначала преобразуйте существующий аудиофайл в обязательный формат ввода:

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

Бегущий карманный сфинкс

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

созданный файл myspeech.txt будет иметь то, что вы ищете.


Если вы новичок в Ubuntu, вам необходимо установить вышеуказанные программы с помощью этой команды:

    sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg

0

Mozilla SpeechDeep с открытым исходным кодом для преобразования речи в текст подойдет. Вам нужно будет установить приложение на рабочий стол Linux. Или вы можете попробовать транскрибировать инструмент преобразования речи в текст на основе браузера, который не требует установки, но вам нужно будет подключиться к Интернету, чтобы загрузить запись на сервер.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.