Я запускал код молекулярной динамики (MD) GROMACS на кластере Ubuntu Linux, состоящем из узлов, содержащих 24 процессора Intel Xeon. Моя конкретная достопримечательность оказывается несколько чувствительной к арифметической точности с плавающей запятой, поэтому мне пришлось запускать GROMACS с двойной точностью, а не с одинарной точностью - несмотря на более высокую вычислительную стоимость двойной точности. Итак, на кластере я скомпилировал GROMACS с двойной точностью.
Я подумываю о покупке некоторых графических процессоров, так как может быть ускорение по отношению к процессорам. Однако мне нужен графический процессор, который позволит мне выполнять арифметику с двойной точностью. Знаете ли вы, если такое оборудование доступно в продаже? Последний пост в списке рассылки GROMACS предполагает , что графические процессоры с двойной точностью не коммерчески доступны:
Аппаратное обеспечение не поддерживает [арифметику двойной точности], но AFAIK.
Эта страница Википедии, кажется, предполагает, что графические процессоры двойной точности встречаются редко, поскольку они могут быть неэффективными:
Реализации с плавающей точкой на графических процессорах Nvidia в основном соответствуют IEEE; Однако это не относится ко всем поставщикам. Это имеет значение для правильности, которые считаются важными для некоторых научных приложений. Хотя 64-битные значения с плавающей запятой (с плавающей запятой двойной точности) обычно доступны на процессорах, они не всегда поддерживаются на графических процессорах; некоторые архитектуры GPU жертвуют соответствием IEEE, в то время как другим вообще не хватает двойной точности. Были попытки эмулировать значения с плавающей запятой двойной точности на графических процессорах; тем не менее, компромисс между скоростью сводит на нет любые преимущества, прежде всего, для выгрузки вычислений на графический процессор.
Эта страница NVIDIA Tesla со ссылкой на «Пиковую производительность с плавающей запятой двойной точности» на диаграмме, похоже, предполагает, что вычисления с двойной точностью могут фактически выполняться на их графических процессорах (хотя и с более высокими вычислительными затратами).
Итак, во что мне верить? У вас есть опыт решения этой проблемы?