Моя проблема в том, что я не знаю энергию фонового шума, поэтому я не могу просто ограничить энергию. Обработка выполняется в режиме реального времени, и у меня есть около 500 мсек, чтобы решить. В идеале я бы хотел, чтобы тихие согласные считались не тишиной.
6
У меня недостаточно информации, чтобы дать полный ответ, но ваша проблема называется обнаружением голосовой активности . Не существует единого согласованного лучшего способа сделать это, и если вы посмотрите, вы, вероятно, натолкнетесь на множество разных подходов. Возможно, некоторые другие могут сделать это немного подробнее.
—
Джейсон Р
@ Михаил Литвин, есть класс нелинейных фильтров (используется в «детектировании энергии» под названием «Teager-Kaiser». Я думаю, что это подмножество так называемых «ядер вольтеров». Извините, я не могу предоставить какие-либо больше информации, но если вы будете искать вокруг этих слов, вы можете найти то, что вы ищете. Я знаю, что метод Teager-Kaiser используется для того, чтобы «когда» звуки кита начинались, а не просто фоновый шум
—
Spacey