В настоящее время мы используем эту команду в сценарии оболочки, чтобы удалить тишину из аудиофайлов:
ffmpeg -i $INFILE -af silenceremove=0:0:0:-1:1:${NOISE_TOLERANCE}dB -ac 1 $SILENCED_FILE -y
Это прекрасно работает, за исключением того, что удаляет всю тишину, в результате чего оставшееся аудио сжимается вместе.
Как это можно сделать, оставляя две или три секунды между каждым фрагментом звука?
Решение должно быть очень эффективным, так как мы будем обрабатывать много аудио и использовать инструмент, который можно довольно легко установить как в Linux, так и в OSX, например, ffmpeg или sox.