Альтернатива дракону NaturallySpeaking?


Ответы:


18

В Википедии есть целая статья, посвященная этой проблеме.

К сожалению, кажется, что в настоящее время нет ни одного решения, которое работает достаточно хорошо, но имеется огромный список проектов, которые находятся в стадии реализации.

Возможно, вы захотите покопаться в списке решений, чтобы увидеть, есть ли что-то, что соответствует вашим потребностям.

Утконос :

Всегда есть возможность запустить Dragon Naturally Speaking с помощью WINE . Проект Platypus создает программное обеспечение для перенаправления вывода Dragon в любое приложение Linux / X, и они очень далеко продвинулись.

Вы должны обязательно взглянуть на это.


5

Обновленный ответ - статья от марта 2018 года: « Лучшие бесплатные инструменты распознавания речи в Linux - программное обеспечение с открытым исходным кодом» .

В этой статье освещается лучшее программное обеспечение для распознавания речи с открытым исходным кодом для Linux. Обратите внимание, что некоторое программное обеспечение находится на ранней стадии разработки и поэтому не готово к широкому распространению.

Прежде чем изучить наши рекомендации, Джаспер заслуживает особого упоминания. Это отличная платформа с открытым исходным кодом для разработки постоянно работающих голосовых приложений. Вы можете быть удивлены, почему HTK не отображается ниже. Безусловно, HTK - это популярный инструментарий для распознавания речи. Но HTK не имеет права участвовать в рекомендуемых решениях. Не потому, что это авторское право принадлежит Microsoft, а просто потому, что это проприетарное программное обеспечение.

Давайте рассмотрим 6 бесплатных инструментов распознавания речи под рукой. Для каждого заголовка мы составили собственную страницу портала с полным описанием и углубленным анализом его возможностей.

Инструменты распознавания речи с открытым исходным кодом

  • DeepSpeech TensorFlow реализация архитектуры DeepSpeech в Baidu.
  • Julius Двухпроходный большой словарь для непрерывного распознавания речи
  • Simon Гибкое программное обеспечение для распознавания речи
  • CMUSphinx Система распознавания речи для мобильных и серверных приложений
  • deepspeech.pytorch Реализация DeepSpeech2 с использованием Baidu Warp-CTC.
  • Инструментарий Kaldi C ++ предназначен для исследователей распознавания речи.

4

Вы можете установить версию Chromium 11 из ppa ppa:chromium-daily/stable( Как добавить PPA ) и добавить --enable-speech-input в конец модуля запуска.

введите описание изображения здесь

Теперь посетите этот сайт и все! Речевой текст в Ubuntu с использованием html5.

Я читал здесь, что если вы говорите медленно, это будет более точным.

введите описание изображения здесь


3

freespeech-вр

Приличная речь с открытым исходным кодом для текстового движка. Здесь исходный код ( на Google Code )

Обратите внимание, что это занимает немного конфигурации, которая менее отточена, чем конфигурация Dragon Naturally Speaking.


2
FreeSpeech, похоже, не поддерживается. Он не предлагал ppa с Ubuntu 10.
JellicleCat

2
Теперь есть порт FreeSpeech для Python 3 .
Dotancohen

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.