Что нужно, чтобы сделать GPU полностью питаемым процессором?
Сравнения их флопов / с достаточно?
Например, если бы мне удалось создать очень старый (Pentium-3) процессор с одним из графических процессоров Nvidia-Fermi, он не смог бы снабжать графический процессор данными в секунду. Каковы критерии для соответствия CPU и GPU, когда требуется OpenCL или аналогичная работа?
Конечно, RAM и BUS будут выбраны одинаково, но как именно?
Предположим, что каждое ядро GPU будет вычислять sqrt, деление и сложение 100 раз за каждую итерацию.
Благодарю.
Редактировать: После работы с opencl в течение многих лет, кажется, что это в основном зависит от алгоритма, а затем от оптимизаций связи (чтение / запись или сопоставление / отображение) и пиковых вычисляемых значений gpus и его способности выполнять чтение + запись + вычисления в одном и том же отрезке времени. Аппаратное обеспечение просто умножает уровень производительности этих параметров (те, которые могут экспоненциально изменять производительность).