Вопросы с тегом «speech-recognition»

3
фильтр шума человеческой речи
Кто-нибудь знает фильтр для ослабления неречевой? Я пишу программное обеспечение для распознавания речи и хотел бы отфильтровать все, кроме человеческой речи. Это может включать фоновый шум, шум, производимый дерьмовым микрофоном, или даже фоновую музыку. Я уже внедрил фильтр первого порядка, который компенсирует спад спектра мощности на 6 дБ, но я …

1
Определение того, насколько звук похож на человеческую речь
В поисках ответа на эту проблему я обнаружил, что эта доска объявлений решила опубликовать мой вопрос в переполнении стека. Я ищу способ определения сходства между аудиосегментом и человеческим голосом, который выражается численно. Я немного искал, но то, что я нашел до сих пор (подробно описано ниже), не совсем соответствует тому, …

1
Чем шумоподавление для распознавания речи отличается от шумоподавления, которое должно сделать речь более «понятной» для людей?
это вопрос, который меня интересовал в течение некоторого времени, главным образом потому, что я сам работаю над подавлением шума для существующей системы распознавания речи. Кажется, что в большинстве работ по технике шумоподавления основное внимание уделяется тому, как сделать речь более понятной для людей или как улучшить нечеткие термины, такие как …

1
Разработка векторного элемента для различения различных звуковых сигналов
Рассмотрим 4 следующих сигнала формы волны: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 …

1
Как сегментировать звук телефонных звонков в тишину / не тишину?
Моя проблема в том, что я не знаю энергию фонового шума, поэтому я не могу просто ограничить энергию. Обработка выполняется в режиме реального времени, и у меня есть около 500 мсек, чтобы решить. В идеале я бы хотел, чтобы тихие согласные считались не тишиной.

2
Как реализовать градиентное преобразование Хафа
Я пытаюсь использовать преобразование Хафа для обнаружения краев и хотел бы использовать градиентные изображения в качестве основы. То , что я сделал до сих пор, учитывая изображение Iразмера [M,N]и ее частных производных gx, gy, чтобы вычислить угол градиента в каждом пикселе , как thetas = atan(gy(x,y) ./ gx. Точно так …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.