Наши моделирования динамики плазмы часто дают слишком много информации. Во время моделирования мы записываем различные физические свойства в сетке (x, y, z, t), которая равна (8192x1024x1024x1500), по крайней мере, для 10 свойств. Эта информация обрабатывается после завершения моделирования. С этим мы
- снимать фильмы о недвижимости,
- выполнить анализ Фурье,
- рассчитать средние свойства.
Этот простой сброс как можно большего количества информации работал хорошо, когда мы изучали небольшие системы. Это дало нам гибкость, чтобы взаимодействовать с результатами и позже решить, что мы хотим с ними делать. Это также позволило нам выделить наши вычислительные ресурсы (время процессора) для простого запуска моделирования.
Мы начали процесс анализа Фурье на лету и фильтрации только для выбранного диапазона шкал длины. По численным причинам нам иногда нужно разрешать шкалы длин, которые меньше, чем мы на самом деле заинтересованы, поэтому в этих случаях этот фильтр очень помогает. Мы также изучаем различные библиотеки параллельного ввода-вывода, например, параметры параллельного ввода-вывода, в частности параллельный HDF5 .
Какие стратегии доступны для максимизации эффективности обработки данных?
Есть ли какая-либо выгода для выполнения всего анализа (не включая постобработку, например, фильмы и сюжеты) на лету?
Я могу представить, что эта проблема возникнет в других областях исследований. Например, у вас может быть симуляция молекулярной динамики, которая должна развиваться в течение длительного времени, но вас интересует короткий момент, когда происходит что-то интересное. Или в CFD, раннее развитие может быть медленным, но как только начинается турбулентность, вам может потребоваться более высокое временное разрешение для мониторинга динамики.
Есть ли в свободном доступе примеры сложных результатов сбора результатов моделирования?