Хорошее решение для преобразования текста в речь для Windows [закрыто]


9

Я использую Windows 7 и знаю, что в моих приложениях есть возможность читать текст, но я ищу хорошую утилиту для сохранения фрагментов текста в виде файла wav или mp3. Возможно, он уже встроен в ОС, но хитро замаскирован. Я знаю, что могу написать программу для вызова API, что является моим следующим шагом, если уже нет хорошего решения.

Мне очень нравится качество системы AT & T , но у нее есть довольно крутые ограничения на использование выпущенного MP3. Я хотел бы использовать их в моем подкасте.

С веб-интерфейсом тоже все в порядке, поскольку он легко создает довольно свободный (WAL, MP3 или другие стандартные аудиофайлы) файл (Public Domain или Creative Commons). Естественно, я предпочитаю бесплатный или открытый исходный код, а не коммерческий, но это не является обязательным требованием.

Ответы:


4

Я пробовал espeak , фестиваль и MaryTTS . Все они генерируют понятные голоса по большей части, но они не очень естественны. Даже с дополнительными голосовыми загрузками для этих систем (например, Mbrola, CMU Arctic) голоса не так велики.

Ивона голос лучшие , что я слышал до сих пор. Они дают вам 30-дневную бесплатную демо-версию, которой достаточно, если у вас есть одноразовое задание. После этого они похожи на 45 долларов / голос. Amazon только что купила компанию, чтобы вы знали, что она солидная ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ ).

Они работают с интерфейсом Microsoft SAPI, что означает, что голоса доступны любой программе, которая поддерживает это (например, Adobe Reader). Я использую их с программой Text To Wav, которая хороша для массового преобразования текстовых файлов в волновые файлы.

редактировать

На самом деле просто перечитайте свой вопрос, и я думаю, что для не личного использования (например, подкасты) цена, вероятно, намного выше для IVONA. В этом случае я бы сказал проверить MaryTTS.


Я только что слушал MaryTTS, и это потрясающее завершение разговоров и фестивалей.
тридцать третье

У MaryTTS отличные голоса, и это тоже бесплатно.
Джим Маккит

Похоже, что преобразование текста в речь для голосов Ivona для настольных компьютеров предоставлено TextAloud
пользователь

6

eSpeak является бесплатным и открытым исходным кодом и предлагает все, что вам нужно.

Он может работать как программа командной строки, чтобы произносить текст из файла или из стандартного ввода.
Также доступна версия общей библиотеки.

* Включает различные тембры, характеристики которых могут быть изменены.
* Может производить речевой вывод в виде файла WAV.
* SSML (язык разметки речи) поддерживается (не завершено),
  а также HTML.
* Компактный размер. Программа и ее данные, в том числе на многих языках,
  составляет около 1 Мбайт.
* Может переводить текст в коды фонем, так что он может быть адаптирован как фронт
  конец для другого двигателя синтеза речи.
* Потенциал для других языков. Некоторые из них включены в различные этапы
  прогресса. Помощь носителей языка для этих или других языков
  приветствуется.
* Средства разработки, доступные для производства и настройки данных фонем.
* Написано на C ++.

В то время как eSpeak кажется интересным, оно может действительно выиграть от руководства по быстрому старту. Спасибо за совет, хотя. Я буду продолжать работать с этим.
Джим Маккит

+1 за eSpeak. Я долго искал приложение для этого. Спасибо, сэр!
Axxmasterr
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.