Если задержка является проблемой, возможно, стоит рассмотреть компромиссы, которые вы можете сделать с архитектурой AMD Fusion. Задержка, которую вы получаете, существенно минимизируется и в некоторых случаях может быть быстрее, чем загрузка ЦП из ОЗУ. Тем не менее, вы получаете удар производительности с использованием уменьшенного недискретного графического процессора.

ал способы уменьшить задержку, вызванную передачей данных назад и вперед от CPU и GPU. Когда я впервые начал использовать CUDA, я заметил, что передача данных между процессором и графическим процессором заняла несколько секунд, но мне было все равно, потому что это не касается небольших программ, которые я пишу. Фактически, задержка, вероятно, не является большой проблемой для подавляющего большинства программ, использующих графические процессоры, включая видеоигры, потому что они все еще намного быстрее, чем если бы они работали на процессоре.

Тем не менее, я немного энтузиаст HPC, и я стал интересоваться направлением своих исследований, когда увидел огромное расхождение между теоретическим пиком FLOPS Тяньхэ-I и фактической измеренной производительностью LINPACK. Это вызвало у меня беспокойство по поводу того, правильно ли я иду по карьерной лестнице.

Использование закрепленной памяти (с блокировкой страницы) с помощью функции cudaHostAlloc () - один из способов снижения задержки (довольно эффективный), но есть ли другие методы, о которых я не знаю? И, чтобы быть ясным, я говорю об оптимизации кода, а не самого оборудования (это работа NVIDIA и AMD).

Как дополнительный вопрос, я знаю, что Dell и HP продают серверы Tesla. Мне интересно, насколько хорошо графический процессор использует приложение базы данных, где вам нужно постоянное чтение с жесткого диска (HDD или SSD), операция, которую может выполнять только процессор,

Ответы на вопрос(1)

Ваш ответ на вопрос