Когда мне следует рассчитывать PSD вместо простого спектра БПФ?


12

У меня есть тридцать второй речевой сигнал, который был дискретизирован с частотой 44,1 кГц. Теперь я хотел бы показать, какие частоты имеет речь. Тем не менее, я не уверен, что будет лучшим способом сделать это. Иногда кажется, что каждый вычисляет абсолютное значение преобразования Фурье, а иногда спектральную плотность мощности. Если я правильно понимаю, последний работает так, что я делю свой сигнал на части, делаю FFT по частям и как-то суммирую их. Оконные функции как-то задействованы. Не могли бы вы немного уточнить это для меня? Я новичок в DSP.


1
Разбиение сигнала на сегменты, нахождение спектра каждого из них и последующее усреднение спектров может помочь уменьшить шум, но также и уменьшить разрешение. см. en.wikipedia.org/wiki/Welch%27s_method
эндолит

Ответы:


8

Теперь я хотел бы показать, какие частоты имеет речь. Тем не менее, я не уверен, что будет лучшим способом сделать это. Иногда кажется, что каждый вычисляет абсолютное значение преобразования Фурье, а иногда спектральную плотность мощности.

Если вы хотите придать физический смысл своему анализу, тогда используйте спектральную плотность мощности (PSD). Это потому, что это просто даст вам мощность вашего сигнала в каждой полосе частот. С другой стороны, если вы не хотите / не заботитесь о физическом значении, но хотите знать, как амплитуды Фурье каждой полосы изменяются относительно друг друга, вы можете придерживаться абсолютной величины.

Икс[N]Икс(е)|Икс(е)||Икс(е)|2

Если я правильно понимаю, последний работает так, что я делю свой сигнал на части, делаю FFT по частям и как-то суммирую их. Оконные функции как-то задействованы. Не могли бы вы немного уточнить это для меня? Я новичок в DSP.

Нет, это не так То, о чем вы здесь говорите, относится к кратковременному преобразованию Фурье (STFT). Это просто прерывание вашего сигнала во временной области, его овдовение, а затем получение фурье-формы. В конце дня у вас все равно будет сложная матрица. Если вы решите взять его абсолютную величину, у вас будет матрица преобразования Фурье абсолютной величины. Если вы возьмете его квадрат абсолютной величины, у вас будет матрица спектральной плотности мощности.


3

Важно понимать, что речь идет о речевом сигнале: его частотные составляющие меняются во времени . Чтобы представить речь в частотной области, мы обычно берем достаточно короткое окно сигнала, в пределах которого можно предположить, что спектр речи существенно не изменяется (обычно 10 мс). Таким образом, мы рассчитываем спектр мощности для каждого последующего окна 10 мс, используя STFT (часто с некоторым перекрытием между окнами), и рассматриваем каждый последующий спектр как «снимок» частотных компонентов речи в это конкретное время. Часто последовательные спектры строятся на трехмерном графике, таком как спектрограммасо временем по оси X, частотой по оси Y и амплитудой, нанесенной в виде фальшивого цвета или интенсивности серой шкалы в каждом местоположении X, Y.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.