Nvidia K20X против GeForce Titan для ускорения GPGPU


10

Я пытаюсь понять разницу между этими двумя видеокартами для академических вычислений, особенно для компонента DGEMM.

Если мы посмотрим на необработанные статистические данные, оба имеют одинаковый чип GK110, имеют сопоставимые статистические данные практически во всех категориях и, как мне кажется, имеют одинаковую архитектуру ядра. До каких-либо скидок K20X примерно в 4 раза дороже Титана. С точки зрения эффективности, кажется, имеет смысл использовать Titan вместо K20X.

Мне трудно понять разницу здесь, кто-нибудь может осветить ситуацию?

В качестве заметки я смотрю на покупку этих карт для стоечного сервера и, по сути, работаю на полном ходу, пока они не умрут; однако я не считаю эффективность использования нескольких графических процессоров для одной работы особенно важной.

Ответы:


13

Есть некоторые различия, однако они не обязательно связаны с оборудованием или спецификациями. Обратите внимание, что это вся информация, которую я получил от форумов или выпусков новостей, так что воспринимайте это с недоверием.

Первый - это «масштабируемость и надежность» ( источник ). K20 был разработан, чтобы сидеть в кластерной системе и работать в режиме полного наклона 24/7. Titan больше предназначен для игр, поэтому он будет работать в этом рабочем цикле, но при таком способе может испытывать проблемы с долгим сроком службы.

Драйверы тоже разные, однако я не уверен в основных различиях. Разница в фокусе дизайна карт, вероятно, приводит к относительно небольшому приросту производительности для карт Tesla на этом фронте.

"Некоторые эксклюзивные функции Tesla включают в себя:

  • NVIDIA GPUDirect RDMA для производительности InfiniBand
  • Hyper-Q для MPI (Hyper-Q для потоков CUDA поддерживается на GeForce GTX TITAN)
  • Защита ECC для всех внутренних и внешних регистров и памяти
  • Поддерживаемые инструменты для управления GPU и кластерами, такие как Bright Computing, Ganglia. "( Источник )

Это указывает на то, что основным отличием является их масштабируемость. Если вы хотите работать на своем рабочем столе в своем офисе, было бы трудно поспорить с «Титаном» над К20 из-за разницы в цене. Если вам нужна дополнительная производительность нескольких K20, найдите себе центр HPC и выиграйте время на их серверах.

Редактировать:

Посмотрев немного больше на ECC, я обновляю этот ответ, чтобы указать на последствия его использования на K20, а не на Titan. Следующая информация - это парафраз информации, найденной здесь .

ECC - это проверка ошибок на DRAM и регистры для GPU. Мягкие ошибки - это когда бит неправильно передан / сохранен. Чем быстрее и ближе соединены цепи, тем выше вероятность мягкой ошибки. Если вы решаете набор связанных ODE или решаете линейную систему, одно число, отключенное на один бит, может значительно изменить результаты невоспроизводимым образом. Большинство стандартных ОЗУ и кэш-памяти в ЦП проверяются на наличие ошибок с помощью ECC.

С другой стороны, графические процессоры, как правило, не имеют ECC, хотя их шины памяти намного быстрее, чем на процессоре. Это связано с тем, что если пиксель на экране по битам выключен на один кадр, качество программы не ухудшается. Эти ошибки также не распространяются. Поэтому можно сэкономить много фишек (и стоимости), пропустив эту функцию. Эта дополнительная сложность, вероятно, вызывает большую часть дополнительной стоимости линии Тесла.


3
Отличный ответ +1! Трудно поверить, что эти функции настолько дороги. Я думаю, что строка «Разработка с GeForce, Развертывание с Tesla» со связанного сайта Nvidia подводит итог важных вопросов. Похоже, лучшее решение на данный момент - это купить несколько GeForce и запускать их до тех пор, пока они, так сказать, не оставят синий дым.
Офион

3
«Это, однако, не остановило их от использования в Окридже». Cray XK7 от OLCF под названием «Titan» использует графические процессоры Tesla K20, а не GTX Titan. NVidia говорит, что GTX Titan имеет «технологию» OLCF Titan, которая является той же лексикой, которую используют, когда говорят, что у экономичного автомобиля есть «технология» автомобиля Формулы-1. (Производительность GTX Titan довольно хорошая, но у нее нет ECC и она не используется ни в каких крупных установках, о которых мне известно.)
Джед Браун

1
Моя ошибка, я неправильно истолковал статью. Я обновлю ответ, чтобы не вводить в заблуждение.
Годрик Провидец

2

На мой взгляд, разница, по-видимому, в основном в сегментации рынка. Если вы ученый, то NVidia хочет, чтобы вы боялись, что ваша статья будет отклонена из-за того, что вы используете GPGPU без столько исправления ошибок ОЗУ, сколько было бы доступно с K20X. Точно так же, если вы являетесь корпорацией, вы, возможно, захотите заплатить 4 раза, если это означает, что у вас меньше шансов на то, что вам предъявят иск по подозрению в том, что ваши расчеты не настолько исправлены, насколько возможно. Отдельные геймеры или любители GPGPU продаются Titan, потому что у них меньше денег, и их сложнее убедить таким образом.


2
Я только запускаю вычисления с ECC, у вас есть хорошая статья, демонстрирующая сбои систем без ECC и логические точки останова, где это выгодно иметь?
Офион


Для тех, кто хочет получить сводную информацию об отличной ссылке от BenC: мягкие ошибки, которые исправит ECC, встречаются крайне редко, и в статье дается рекомендация отключить ECC на Tesla для увеличения скорости. Предостережение: это не было на самом деле проверено с потребительскими графическими процессорами.
полу-внешнее

0

Это действительно зависит от приложения, которое вы запускаете. GPUGRID.net работает на машинах без ECC, и все в порядке. Результаты так же хороши, как и на любой другой платформе. Acellera также продает оборудование с картами GeForce, и только в очень немногих случаях графические процессоры выходят из строя. GeForce - это все, что вам нужно.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.