Сходство двух дискретных преобразований Фурье?


14

В моделировании климата вы ищете модели, которые могут адекватно отображать климат Земли. Это включает в себя показ полуциклических моделей: такие вещи, как южное колебание Эль-Ниньо. Но проверка модели обычно происходит в течение относительно коротких периодов времени, когда имеются достаточные данные наблюдений (последние ~ 150 лет). Это означает, что ваша модель может отображать правильные шаблоны, но не в фазе, так что линейные сравнения, такие как корреляция, не поймут, что модель работает хорошо.

Дискретные преобразования Фурье обычно используются для анализа климатических данных ( вот пример ), чтобы подобрать такие циклические закономерности. Существует ли какая-либо стандартная мера сходства двух ДПФ, которую можно было бы использовать в качестве инструмента проверки (т. Е. Сравнение между ДПФ для модели и показателем для наблюдений)?

Имеет ли смысл брать интеграл от минимума двух нормализованных по площади ДПФ (используя абсолютные реальные значения)? Я думаю, что это приведет к оценке , где х = 1x[0,1]x=1точно такие же шаблоны, а x=0совершенно разные модели. Каковы могут быть недостатки такого метода?


3
Вы рассматривали использование когерентности (в смысле обработки сигнала, а не статистического), кросс-спектральной меры? Я не уверен, что это тип измерения, который вы ищете.
Jonsca

@jonsca: Интересные вещи. Я, конечно, не ищу причинно-следственную связь, но я вижу, как это может быть полезно. Пример на этой странице википедии немного странный (почему он не включает барометрическое давление в качестве переменной модели?). Кроме того, я не уверен, откуда
взялась

Это хороший вопрос. Этот пример был добавлен в статью с момента моего последнего прочтения. Я подозреваю, что это может быть связано с тем, что когерентность сосредоточена на дневной и двухдневной частотах (поэтому связана с ежедневным приливным явлением), но это только предположение ...
jonsca

(Я не знаю, интегрировались ли они, чтобы найти эти 90%, хотя)
jonsca

Ответы:


12

Спектральная когерентность при правильном использовании сделает это. Когерентность вычисляется на каждой частоте и, следовательно, является вектором. Следовательно, сумма взвешенной согласованности будет хорошей мерой. Обычно вы хотите взвесить когерентность на частотах, которые имеют высокую энергию в спектральной плотности мощности. Таким образом, вы будете измерять сходства на частотах, которые доминируют во временном ряду, а не взвешивать когерентность с большим весом, когда содержание этой частоты во временном ряду незначительно.

Итак, простыми словами - основная идея состоит в том, чтобы найти частоты, на которых амплитуда (энергия) в сигналах высока (интерпретировать как частоты, которые в основном составляют каждый сигнал), а затем сравнить сходства на этих частотах с более высоким весом и сравните сигналы на остальных частотах с меньшим весом.

Область, которая занимается вопросами такого рода, называется кросс-спектральным анализом. http://www.atmos.washington.edu/~dennis/552_Notes_6c.pdf - отличное введение в кросс-спектральный анализ.

Оптимальное отставание: посмотрите на мой ответ здесь: Как соотнести два временных ряда с возможными временными различиями

Это касается нахождения оптимального запаздывания с использованием спектральной когерентности. R имеет функции для вычисления спектральной плотности мощности, авто- и кросс-корреляций, преобразований Фурье и когерентности. Вы должны исправить код, чтобы найти оптимальную задержку, чтобы получить макс. взвешенная согласованность. Тем не менее, код для взвешивания вектора когерентности с использованием спектральной плотности также должен быть написан. После чего вы можете суммировать взвешенные элементы и усреднить их, чтобы получить сходство, наблюдаемое при оптимальной задержке.


1
Это отличный ресурс! Он хорошо разбирается в проверке гипотезы, которой удобно избегать во многих материалах о согласованности
Джонса

2

Вы пробовали другой подход для обнаружения / моделирования климатических сигналов, например вейвлет-анализ? Большая проблема, которая может возникнуть с ДПФ в анализе климата, на самом деле является тем, о чем вы упоминаете: колебания не являются идеально периодическими, и они обычно имеют разные промежутки времени, поэтому они могут фактически иметь много разных диапазонов колебаний, что довольно запутанно с точки зрения преобразования Фурье ,

Вейвлет-анализ больше подходит для климатических сигналов, поскольку они позволяют проверять различные временные интервалы колебаний; так же, как разные частоты воспроизводятся музыкальным инструментом в разное время, вы можете проверять разные частоты в разные промежутки времени с помощью вейвлет-преобразования.

Если вам интересно, эта статья Lau & Weng (1995) должна стереть большинство ваших сомнений относительно этого метода. Наиболее интересным является то, что вейвлет-преобразование модели и преобразование данных практически сопоставимы, поскольку вы можете напрямую сравнивать временной интервал, который предсказывает ваша модель, оставляя в стороне все диапазоны паразитных колебаний, которых нет.

PS: Я должен добавить, что я хотел опубликовать это как комментарий, потому что это на самом деле не то, о чем просит OP, но мой комментарий был бы слишком большим, и я решил опубликовать его как ответ, который может пригодиться, так как альтернативный подход к этому из DFT.


1

Я проголосовал за и во-вторых использование анализа на основе вейвлетов и спектрограмм в качестве альтернативы dft. Если вы можете разложить ваши ряды на локализованные частотно-временные интервалы, это уменьшит проблемы фурье апериодичности и нестационарности, а также обеспечит хороший профиль дискретизированных данных для сравнения.

Как только данные сопоставлены с трехмерным набором спектральной энергии в зависимости от времени и частоты, евклидово расстояние может использоваться для сравнения профилей. Идеальное совпадение будет приближаться к нижнему пределу нуля. * Вы можете посмотреть области анализа данных временных рядов и распознавания речи для подобных подходов.

* обратите внимание, что процесс вейвлет-биннинга несколько отфильтрует информационное содержимое. Если не может быть потерь в сравниваемых данных, может быть более подходящим сравнение с использованием евклидова расстояния во временной области

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.