Масштабируемость быстрого преобразования Фурье (БПФ)

12

Чтобы использовать быстрое преобразование Фурье (FFT) для данных с равномерной выборкой, например, в связи с решателями PDE, хорошо известно, что FFT представляет собой алгоритм ). Насколько хорошо масштабируется БПФ при параллельной обработке при (т. Е. Очень большой)? $\mathcal{O}(n\log(n)$ $n\to\infty$

pde fftw fourier-analysis

— Аллан П. Энгсиг-Каруп
источник

1

Я немного запутался. Вы говорите о том, как время выполнения масштабируется для фиксированного числа процессоров при увеличении числа точек данных, как время выполнения масштабируется для фиксированного числа точек данных при увеличении числа или процессоров, или как время выполнения масштабируется для фиксированное соотношение точек данных на процессор при увеличении количества точек данных?

— Джефф Оксберри

Как слабое, так и сильное масштабирование.

— Аллан П. Энгсиг-Каруп

8

Это больше , чем неподтвержденная продемонстрировали доказательства, но представляется , что существующие реализации для FFT, таких как FFTW , есть предел их масштабирования способности.

${\bf k}$ $O(10^7)$

Но главная идея здесь заключается в том, что БПФ должно расширяться; однако иногда возникают неожиданные ограничения и взаимодействия, которые переходят от теоретического рассмотрения производительности алгоритма к его практической реализации на реальной платформе HPC.

— aeismail
источник

6

$O(n)$

— Джед браун
источник

5

$n$ $d$ $d$

Поиск «параллельного БПФ» или «псевдоспектральной масштабируемости» в Google Scholar дает массу информации, которую я не могу оценить. Но это выглядит как хороший недавний пример того, что может быть достигнуто на практике:

Гибридная схема MPI-OpenMP для масштабируемых параллельных псевдоспектральных вычислений для турбулентности жидкости

Абстрактный:

Представлена гибридная схема, которая использует MPI для параллелизма распределенной памяти и OpenMP для параллелизма совместно используемой памяти. Работа мотивирована желанием достичь исключительно высоких чисел Рейнольдса в псевдоспектральных вычислениях турбулентности жидкости на появляющихся петаскальных, с большим числом ядер, массивно параллельных системах обработки. Гибридная реализация основана на хорошо проверенном масштабируемом параллельном MPI псевдоспектральном коде и дополняет его. Гибридная парадигма приводит к новой картине декомпозиции доменов псевдоспектральных сеток, что полезно для понимания, среди прочего, трехмерного транспонирования глобальных данных, необходимых для параллельных быстрых преобразований Фурье, которые являются центральным компонентом числовые дискретизации. Подробности гибридной реализации предоставляются, и тесты производительности иллюстрируют полезность метода. Показано, что гибридная схема обеспечивает почти идеальную масштабируемость до ~ 20000 вычислительных ядер с максимальной средней эффективностью 83%. Представлены данные, демонстрирующие, как выбрать оптимальное количество процессов MPI и потоков OpenMP для оптимизации производительности кода на двух разных платформах.

— Дэвид Кетчесон
источник

1

$O(n)$

$O(\log n)$

$O(n)$

— Дэн
источник

1

В БПФ существует значительный объем связи, но, безусловно, нет необходимости (или желательно) собирать результат на одном узле. Очень распространенным применением БПФ является прямое численное моделирование турбулентности, когда оно используется для применения нелинейного члена конвекции в реальном пространстве, в то время как остальная часть моделирования выполняется в пространстве Фурье. Это категорически не требует сериализации результата. В целом при параллельных вычислениях «большие» данные всегда должны храниться и анализироваться в распределенной форме.

— Джед Браун