Я пытаюсь обнаружить и классифицировать неречевые звуки. В настоящее время я использую ряд движущихся перекрывающихся спектров мощности из обучающих звуков в качестве функций, которые я ищу.
Когда я делаю анализ, я просто вычисляю одинаковое количество перекрывающихся спектров, чтобы число функций было одинаковым. На данный момент производительность не очень хорошая, она может обнаружить только тишину против безмолвия.
Какие методы существуют для этого типа обнаружения сигнала? Одна из моих проблем заключается в том, что для звуков разной длины во временной области могут быть разные длины векторов объектов, что не позволяет использовать один и тот же классификатор, но я застрял на этом.