Вопросы с тегом «gpu»

Блок графической обработки - специализированный, относительно недорогой аппаратный блок, созданный для быстрых графических вычислений и научных вычислений с высокой степенью параллелизма данных.

10
Какие проблемы хорошо подходят для вычислений на GPU?
Так что я неплохо разбираюсь в том, какие проблемы, с которыми я работаю, являются лучшими в сериале, и которыми можно управлять параллельно. Но сейчас у меня нет особого представления о том, что лучше всего обрабатывать вычислениями на базе ЦП, и что следует выгружать в графический процессор. Я знаю, что это …
84 gpu 

1
CUDA против OpenCL по состоянию на конец 2013 года
Как CUDA и OpenCL сравниваются друг с другом в конце 2013 года с точки зрения программиста? Моя группа думает о том, чтобы попытаться использовать вычисления на GPU. Будем ли мы значительно ограничивать себя, выбирая оборудование, которое поддерживает только OpenCL, но не CUDA? Чтобы быть более конкретным, правильны ли следующие предположения? …
34 hpc  gpu  cuda  opencl 

4
Для каких статистических методов GPU быстрее, чем CPU?
Я только что установил графическую карту Nvidia GT660 на свой рабочий стол, и после некоторой борьбы мне удается связать ее с R. Я играл с несколькими R-пакетами, использующими графические процессоры, особенно gputools, и сравнивал время, затрачиваемое моим GPU и процессором на выполнение некоторых основных операций: инвертирующие матрицы (процессор быстрее) декомпозиция …
18 r  gpu 

4
Поддерживают ли доступные в настоящее время графические процессоры двойной точности с плавающей запятой?
Я запускал код молекулярной динамики (MD) GROMACS на кластере Ubuntu Linux, состоящем из узлов, содержащих 24 процессора Intel Xeon. Моя конкретная достопримечательность оказывается несколько чувствительной к арифметической точности с плавающей запятой, поэтому мне пришлось запускать GROMACS с двойной точностью, а не с одинарной точностью - несмотря на более высокую вычислительную …

3
Евклидово расстояние в Октаве
Я хотел бы знать, есть ли быстрый способ вычисления евклидова расстояния двух векторов в октаве. Кажется, что для этого нет специальной функции, так что я должен просто использовать формулу с sqrt?

2
Варианты решения систем ODE на графических процессорах?
Я хотел бы вывести системы решения ODE на графические процессоры в «тривиально распараллеливаемой» обстановке. Например, анализ чувствительности с 512 различными наборами параметров. В идеале я хочу решать ODE с помощью интеллектуального адаптивного временного шага, такого как CVODE, а не с фиксированным временным шагом, как Forward Euler, но запускать его на …
15 ode  gpu 

1
Научные вычисления на Python с современными графическими процессорами с двойной точностью
Кто-нибудь здесь использовал научные вычисления двойной точности с графическими процессорами нового поколения (например, K20) через Python? Я знаю, что эта технология быстро развивается, но каков наилучший способ сделать это в настоящее время? GPU не входит в число популярных научных библиотек Python numpy и scipy, и я хотел использовать theano, но, …
14 python  gpu  precision 

4
Параллельные (GPU) алгоритмы для асинхронных клеточных автоматов
У меня есть коллекция вычислительных моделей, которые можно описать как асинхронные клеточные автоматы. Эти модели напоминают модель Изинга, но немного сложнее. Кажется, что такие модели выиграли бы от работы на GPU, а не на CPU. К сожалению, распараллелить такую ​​модель довольно непросто, и мне совершенно не понятно, как это сделать. …

2
Каковы наиболее быстрые доступные реализации BLAS / LAPACK или других подпрограмм линейной алгебры в системах с графическим процессором?
Например, у nVidia есть CUBLAS, который обещает ускорение в 7-14 раз. Наивно, это далеко не теоретическая пропускная способность любой из видеокарт nVidia. Каковы проблемы в ускорении линейной алгебры на графических процессорах, и есть ли уже доступные более быстрые линейные алгебраические маршруты?

3
Nvidia K20X против GeForce Titan для ускорения GPGPU
Я пытаюсь понять разницу между этими двумя видеокартами для академических вычислений, особенно для компонента DGEMM. Если мы посмотрим на необработанные статистические данные, оба имеют одинаковый чип GK110, имеют сопоставимые статистические данные практически во всех категориях и, как мне кажется, имеют одинаковую архитектуру ядра. До каких-либо скидок K20X примерно в 4 …

3
Тяга для программирования на GPU
Я очень новичок в программировании GPGPU, поэтому, пожалуйста, прости меня, если вопрос не особенно уместен. Из того, что я понимаю, программирование на GPU - очень сложная часть инженерной работы по сравнению с обычным программированием на CPU. Нужно быть очень осторожным в вопросах расхождения, тайлинга, распределенного распределения памяти и перекрытия связи …

2
Параллельное вычисление больших ковариационных матриц
Нам нужно вычислить ковариационные матрицы с размерами от до . У нас есть доступ к графическим процессорам и кластерам, мы задаемся вопросом, каков наилучший параллельный подход для ускорения этих вычислений.10000×1000010000×1000010000\times10000100000×100000100000×100000100000\times100000

2
Самый быстрый способ найти собственные пары малой несимметричной матрицы на GPU в разделяемой памяти
У меня есть проблема, когда мне нужно найти все положительные (так как собственное значение положительно) собственные пары небольшой (обычно меньше, чем 60x60) несимметричной матрицы. Я могу прекратить вычислять, когда собственное значение меньше определенного порога. Я знаю, что собственные значения реальны. Какие-нибудь предложения по алгоритмам, которые я мог бы использовать, чтобы …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.