Ndd
Поиск «параллельного БПФ» или «псевдоспектральной масштабируемости» в Google Scholar дает массу информации, которую я не могу оценить. Но это выглядит как хороший недавний пример того, что может быть достигнуто на практике:
Гибридная схема MPI-OpenMP для масштабируемых параллельных псевдоспектральных вычислений для турбулентности жидкости
Абстрактный:
Представлена гибридная схема, которая использует MPI для параллелизма распределенной памяти и OpenMP для параллелизма совместно используемой памяти. Работа мотивирована желанием достичь исключительно высоких чисел Рейнольдса в псевдоспектральных вычислениях турбулентности жидкости на появляющихся петаскальных, с большим числом ядер, массивно параллельных системах обработки. Гибридная реализация основана на хорошо проверенном масштабируемом параллельном MPI псевдоспектральном коде и дополняет его. Гибридная парадигма приводит к новой картине декомпозиции доменов псевдоспектральных сеток, что полезно для понимания, среди прочего, трехмерного транспонирования глобальных данных, необходимых для параллельных быстрых преобразований Фурье, которые являются центральным компонентом числовые дискретизации. Подробности гибридной реализации предоставляются, и тесты производительности иллюстрируют полезность метода. Показано, что гибридная схема обеспечивает почти идеальную масштабируемость до ~ 20000 вычислительных ядер с максимальной средней эффективностью 83%. Представлены данные, демонстрирующие, как выбрать оптимальное количество процессов MPI и потоков OpenMP для оптимизации производительности кода на двух разных платформах.