Обработка сигнала speech-recognition

3

Кто-нибудь знает фильтр для ослабления неречевой? Я пишу программное обеспечение для распознавания речи и хотел бы отфильтровать все, кроме человеческой речи. Это может включать фоновый шум, шум, производимый дерьмовым микрофоном, или даже фоновую музыку. Я уже внедрил фильтр первого порядка, который компенсирует спад спектра мощности на 6 дБ, но я …

17 filters audio noise speech-recognition

1

Определение того, насколько звук похож на человеческую речь

В поисках ответа на эту проблему я обнаружил, что эта доска объявлений решила опубликовать мой вопрос в переполнении стека. Я ищу способ определения сходства между аудиосегментом и человеческим голосом, который выражается численно. Я немного искал, но то, что я нашел до сих пор (подробно описано ниже), не совсем соответствует тому, …

12 audio algorithms speech-recognition

1

Чем шумоподавление для распознавания речи отличается от шумоподавления, которое должно сделать речь более «понятной» для людей?

это вопрос, который меня интересовал в течение некоторого времени, главным образом потому, что я сам работаю над подавлением шума для существующей системы распознавания речи. Кажется, что в большинстве работ по технике шумоподавления основное внимание уделяется тому, как сделать речь более понятной для людей или как улучшить нечеткие термины, такие как …

10 noise speech-recognition speech-processing noise-cancellation

1

Разработка векторного элемента для различения различных звуковых сигналов

Рассмотрим 4 следующих сигнала формы волны: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 …

10 computer-vision frequency-spectrum autocorrelation speech-recognition

1

Как сегментировать звук телефонных звонков в тишину / не тишину?

Моя проблема в том, что я не знаю энергию фонового шума, поэтому я не могу просто ограничить энергию. Обработка выполняется в режиме реального времени, и у меня есть около 500 мсек, чтобы решить. В идеале я бы хотел, чтобы тихие согласные считались не тишиной.

9 audio speech-recognition

2

Как реализовать градиентное преобразование Хафа

Я пытаюсь использовать преобразование Хафа для обнаружения краев и хотел бы использовать градиентные изображения в качестве основы. То , что я сделал до сих пор, учитывая изображение Iразмера [M,N]и ее частных производных gx, gy, чтобы вычислить угол градиента в каждом пикселе , как thetas = atan(gy(x,y) ./ gx. Точно так …

9 image-processing edge-detection image-processing computer-vision image-registration discrete-signals noise bpsk snr demodulation bpsk multipath synchronization timing image-processing filters algorithms edge-detection sampling demodulation bpsk synchronization timing fft fourier-transform delay audio speech-recognition soft-question discrete-signals discrete-signals autocorrelation frequency computer-vision

Вопросы с тегом «speech-recognition»