Вопросы с тегом «performance»

Вопросы о скорости выполнения и использовании памяти алгоритмами, структурами данных, языками и библиотеками.

4
Как бороться со слишком большим количеством данных?
Наши моделирования динамики плазмы часто дают слишком много информации. Во время моделирования мы записываем различные физические свойства в сетке (x, y, z, t), которая равна (8192x1024x1024x1500), по крайней мере, для 10 свойств. Эта информация обрабатывается после завершения моделирования. С этим мы снимать фильмы о недвижимости, выполнить анализ Фурье, рассчитать средние …

3
Есть ли какая-то польза от компиляции LAPACK из исходного кода по сравнению с установкой готового пакета из Ubuntu?
Я знаю, что ATLAS может оптимизировать себя для машины, на которой он компилируется, и, таким образом, максимальная выгода достигается компиляцией из исходного кода. Есть ли польза от компиляции LAPACK из исходного кода? Было бы намного проще просто установить готовый пакет.

5
Расчет разреженной структуры для матриц конечных элементов
Вопрос: Какие методы доступны для точного и эффективного расчета разреженной структуры матрицы конечных элементов? Информация: я работаю над решателем уравнения давления Пуассона, использую метод Галеркина с квадратичной базой Лагранжа, написанный на C, и использую PETSc для хранения разреженных матриц и подпрограмм KSP. Чтобы эффективно использовать PETSc, мне нужно предварительно выделить …

3
Использование памяти в фортране при использовании массива производного типа с указателем
В этом примере программы я делаю одно и то же (по крайней мере, мне так кажется) двумя разными способами. Я запускаю это на своем компьютере с Linux и наблюдаю за использованием памяти с помощью top. Используя gfortran, я обнаружил, что в первом случае (между «1» и «2») используемая память составляет …

4
Подсчет FLOP для библиотечных функций
При оценке числа FLOP в простой функции часто можно просто перейти к выражению, объединяющему основные арифметические операторы. Однако в случае математических утверждений, включающих четное деление, этого сделать нельзя, и можно ожидать, что он сможет сравнивать с подсчетами FLOP функций только с сложениями и умножениями. Ситуация еще хуже, когда операция реализована …

2
Какой самый быстрый способ вычислить все собственные значения очень большой и разреженной матрицы смежности в python?
Я пытаюсь выяснить, существует ли более быстрый способ вычисления всех собственных значений и собственных векторов очень большой и разреженной матрицы смежности, чем использование scipy.sparse.linalg.eigsh. Насколько я знаю, этот метод использует только разреженность и атрибуты симметрии матрицы. Матрица смежности также является двоичной, что заставляет меня думать, что есть более быстрый способ …

2
Октава: вычислить расстояние между двумя матрицами векторов
Предположим, у меня есть две матрицы Nx2, Mx2, представляющие N, M 2d векторов соответственно. Есть ли простой и хороший способ рассчитать расстояния между каждой векторной парой (n, m)? Простой, но неэффективный способ, конечно: d = zeros(N, M); for i = 1:N, for j = 1:M, d(i,j) = norm(n(i,:) - m(j,:)); …

3
В каких случаях применения схемы аддитивного прекондиционирования превосходят мультипликативные?
Как в методах декомпозиции доменов (DD), так и в многосеточных (MG) можно применять применение блочных обновлений или грубых исправлений как аддитивное или мультипликативное . Для точечных решателей это различие между итерациями Якоби и Гаусса-Зейделя. Мультипликативный сглаживатель для действующий как S ( x o l d , b ) = x …

2
Какова основная структура производительности научного кода?
Рассмотрим два компьютера с разными аппаратными и программными конфигурациями. При запуске одного и того же последовательного кода Навье-Стокса на каждой платформе требуется x и y время для выполнения одной итерации для компьютеров 1 и 2 соответственно. В этом случае - это разница во времени итерации между компьютером 1 и компьютером …

1
Статистические модели для локальной памяти / вычислений, задержки в сети и дрожания полосы пропускания в HPC
Параллельные вычисления часто моделируются с использованием детерминированной локальной скорости вычислений, времени ожидания и пропускной способности сети. На самом деле, они пространственно переменные и недетерминированные. Такие исследования, как Skinner и Kramer (2005), наблюдают мультимодальные распределения, но анализ производительности, похоже, всегда использует либо детерминистические, либо гауссовские распределения (не только неточные, но и …

3
Как реализовать эффективную функцию индексации для двухчастичных интегралов <ij | kl>?
Это простая задача перечисления симметрии. Я даю полный обзор, но знание квантовой химии не требуется. Двухчастичный интеграл : И имеет следующие 4 симметрии: У меня есть функция, которая вычисляет интеграл и сохраняет его в одномерном массиве , проиндексированном следующим образом:⟨ я J | к л ⟩ = ∫ г | …

3
Nvidia K20X против GeForce Titan для ускорения GPGPU
Я пытаюсь понять разницу между этими двумя видеокартами для академических вычислений, особенно для компонента DGEMM. Если мы посмотрим на необработанные статистические данные, оба имеют одинаковый чип GK110, имеют сопоставимые статистические данные практически во всех категориях и, как мне кажется, имеют одинаковую архитектуру ядра. До каких-либо скидок K20X примерно в 4 …

1
Каково влияние семантики перемещения C ++ 11 в контексте научных вычислений?
C ++ 11 вводит семантику перемещения, которая может, например, улучшить производительность кода в ситуациях, когда C ++ 03 потребуется выполнить конструкцию копирования или назначение копирования. В этой статье сообщается, что при компиляции с C + 11 следующий код ускоряется в 5 раз: vector&lt;vector&lt;int&gt; &gt; V; for(int k = 0; k …

3
Литературные ссылки для моделирования текущих и будущих затрат энергии на операции с плавающей запятой и передачу данных
Я ищу самую важную литературу и ссылки на слайды для моделирования текущих и будущих затрат энергии на операции с плавающей запятой и передачу данных через ЦП, память, сеть и хранилище. Я пометил этот вопрос как вики сообщества, и я бы предпочел, чтобы вы ограничивали каждый ответ следующим форматом: Заголовок, Авторы, …

3
Каковы издержки при умножении разреженных матриц
Умножается ли матричное умножение (как Mat * Mat, так и Mat * Vec) на количество ненулевых элементов или на размер матрицы? Или какая-то комбинация двух. Как насчет формы. Например, у меня есть матрица 100 x 100 с 100 значениями в ней или матрица 1000 x 1000 с 100 значениями в …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.