ДПФ с геометрически разнесенными бункерами?


16

Традиционное дискретное преобразование Фурье (DFT) и его двоюродный брат, FFT, создают ячейки, которые расположены на одинаковом расстоянии. Другими словами, вы получаете что-то вроде первых 10 герц в первом бине, 10,1–20 во втором и т. Д. Однако мне нужно что-то немного другое. Я хочу, чтобы диапазон частот, охватываемых каждым бином, увеличивался геометрически. Предположим, я выбрал множитель 1,5. Тогда у нас 0–10 в первом бине, я хочу 11–25 во втором бине, 26–48 в третьем и т. Д. Можно ли изменить алгоритм DFT, чтобы он вел себя таким образом?


Вы всегда можете рассчитать DFT в точках интереса. Также мне в голову приходят дискретные вейвлет-преобразования и банки фильтров . Может стоит посмотреть на них.


2
Плохо сформулирован. То, что вы хотите, не является ни новым, ни улучшением во многих случаях.
hotpaw2


2
DFT и FFT не двоюродные братья. Они дают одинаковые результаты.
Фонон

Ответы:


17

Процитирую мою диссертацию:

Набор преобразований получает имя константы Q и аналогичен преобразованию Фурье.

Вычисление дискретного преобразования Фурье может быть очень эффективным при использовании использования быстрого преобразования Фурье. Однако мы замечаем, что энергия сигнала делится на частотные сегменты одинакового размера по всему спектру. Хотя во многих случаях это полезно, мы отмечаем ситуации, когда это равномерное распределение является неоптимальным. Важный пример такого случая наблюдается с анализом музыкальных частот. В западной музыке частоты, составляющие музыкальную гамму, геометрически разнесены. Таким образом, мы видим, что карта между частотными бинами дискретного преобразования Фурье и частотами музыкальных шкал недостаточна в том смысле, что эти бины плохо совпадают. Постоянное Q-преобразование решает эту проблему.

Целью константы Q является создание набора логарифмически разнесенных частотных бинов, в которых ширина частотного бина является произведением предыдущего. В результате мы можем создать идентичное количество ячеек на музыкальную ноту по всему звуковому спектру, таким образом поддерживая постоянный уровень точности для каждой музыкальной ноты. Частотные интервалы становятся шире к более высоким частотам и сужаются к более низким частотам. Этот разброс в точности определения частоты близко имитирует то, как человеческая слуховая система реагирует на частоты.

Кроме того, близкое совпадение нот в западных масштабах делает константу Q особенно полезной при обнаружении нот; определение значения музыкальной ноты, а не явного значения частоты. Кроме того, константа Q упрощает процесс анализа тембра. Частоты музыкальной ноты, исполняемой инструментом, часто состоят из гармонически связанных частей. Тембр инструмента можно охарактеризовать отношениями гармоник. С постоянным Q-преобразованием гармоники равномерно распределены по бинам независимо от основной частоты. Это значительно упрощает процесс идентификации инструмента, играющего ноту в любом месте шкалы, просто сдвигая характеристику между ячейками.

Эффективный алгоритм преобразования дискретного преобразования Фурье (которое может быть вычислено с помощью БПФ) в преобразование с константой Q подробно описан в работе Brown and Puckette (1992).


1

Существуют значительные математические предположения в DFT (БПФ). Наиболее важным в этом случае является то, что вы выполняете усеченное синусоидальное преобразование с бесконечным временем. Второе - это то, что усеченные сигналы времени и усеченной частоты предполагаются обернутыми по модулю (круговые). Контейнеры, разнесенные в нормальном БПФ, образуют ортонормированный набор только из-за этих предположений (и четного арифметического интервала). следовательно, временная пара <-> является полностью обратимой.

Преобразование с постоянным Q не усекается так хорошо, поэтому любая практическая реализация не дает идеального орто-нормального спаривания. Ядро представляет собой бесконечно длинную экспоненциально убывающую синусоиду и поэтому не может иметь кругового преимущества, указанного выше. Если вы не усекаете, они формируют ортонормированный набор.

Вейвлет-преобразования, как правило, разнесены по степени 2, что не очень полезно для детальной оценки частоты.

Предложение о неравномерном расположении стандартного синусоидального ДПФ будет пропускать информацию в широко разнесенной области, в то время как оно будет дублировать информацию в густо разнесенной области. Если только для каждой частоты не используется другая функция аподизации ... очень дорого.

Одно практическое решение состоит в том, чтобы сделать повторную процедуру с половинным спектром> decimate-by-2, чтобы получить основанные на октаве подсекции, чтобы удовлетворить некоторую минимаксную ошибку оценки на октаву. Часть-спектр-> десятичное соотношение может быть установлена ​​на любое отношение для достижения любой степени детализации. Тем не менее, довольно интенсивные вычисления.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.