Преобразование звука / аудио файла в текстовые файлы [дубликаты]

Возможное дублирование:
распознавание речи - MP3 в текстовое программное обеспечение

Как преобразовать звуковой / аудиофайл (например, wma, mp3, wav) в обычный текстовый файл? (Текстовый файл должен иметь расшифровку звука / звука)

audio

— Ларри Моррис
источник

@slhck, ссылка предоставляется только для MP3.

— Ларри Моррис

с речью в текстовую программу.

Вы действительно можете сделать это в Windows7, потому что он встроил в него одну из худших речевых текстовых программ, которые они делают. , , неважно.

Дракон, естественно говоря. если я скажу вам больше, это будет звучать как коммерция :-)

Проблема в том, что вся речь в тексте требует обучения программы для понимания. Подавайте то, что вы обычно пишете (или другие видео-транскрипты), и тренируйте своим реальным голосом. Когда речь заходит о попытке извлечь 2-4 голоса из разговора, он настолько ударил, что вы потратили бы больше времени на его исправление, чем если бы вы набирали его с нуля. Это вполне возможно, и (опять же) следует попробовать.

Пример: после обучения я должен напечатать это с ним, потому что это будет писать лучше, чем я, исправлять грамматику и правильно пунктуироваться. Но я могу работать всю ночь, доводя до совершенства, а затем просыпаться утром с новым голосом, и это снова доставит мне неприятности. Изменение микрофонов, или изменение положения микрофона, или изменение уровней, подаваемых на него, также сделают его грубым, пока он не научится снова.

Таким образом, остается «расшифровка», когда вы говорите весь фильм (в наушниках), перечитываете все части, а затем возвращаетесь ко всему документу, внося исправления. Я использовал этот метод, прежде чем транскрибировать юридическое видео осаждения.

— Psycogeek
источник

Я согласен с вами, но мне было интересно, есть ли такое приложение, которое является лучшим среди своих коллег и стоит попробовать его. Он должен быть способен обслуживать столько аудио / звукового формата (не только mp3), но и обеспечивать до 90% точности преобразования звука в текст.

— Ларри Моррис

Я подозреваю, что есть программное обеспечение очень высокого уровня или даже выделенные машины, которые гораздо более способны, чем то, что они продают для меня в магазине. Однажды я подумал, что речь президентов в средствах массовой информации была написана в прямом эфире на машине, а не на человеке, потому что она «звучит одинаково», ошибки клавиатуры.

— Psycogeek

расскажите мне больше об этом программном обеспечении очень высокого уровня и где я могу его найти

— Ларри Моррис

Я не знаю. вот поиск, который получает некоторую информацию google.com/…

— Psycogeek