Если задержка является проблемой, возможно, стоит рассмотреть компромиссы, которые вы можете сделать с архитектурой AMD Fusion. Задержка, которую вы получаете, существенно минимизируется и в некоторых случаях может быть быстрее, чем загрузка ЦП из ОЗУ. Тем не менее, вы получаете удар производительности с использованием уменьшенного недискретного графического процессора.

Question

Jun 28, 2011, 04:22 AM

optimization memory latency cuda data-transfer

Если задержка является проблемой, возможно, стоит рассмотреть компромиссы, которые вы можете сделать с архитектурой AMD Fusion. Задержка, которую вы получаете, существенно минимизируется и в некоторых случаях может быть быстрее, чем загрузка ЦП из ОЗУ. Тем не менее, вы получаете удар производительности с использованием уменьшенного недискретного графического процессора.

ал способы уменьшить задержку, вызванную передачей данных назад и вперед от CPU и GPU. Когда я впервые начал использовать CUDA, я заметил, что передача данных между процессором и графическим процессором заняла несколько секунд, но мне было все равно, потому что это не касается небольших программ, которые я пишу. Фактически, задержка, вероятно, не является большой проблемой для подавляющего большинства программ, использующих графические процессоры, включая видеоигры, потому что они все еще намного быстрее, чем если бы они работали на процессоре.

Тем не менее, я немного энтузиаст HPC, и я стал интересоваться направлением своих исследований, когда увидел огромное расхождение между теоретическим пиком FLOPS Тяньхэ-I и фактической измеренной производительностью LINPACK. Это вызвало у меня беспокойство по поводу того, правильно ли я иду по карьерной лестнице.

Использование закрепленной памяти (с блокировкой страницы) с помощью функции cudaHostAlloc () - один из способов снижения задержки (довольно эффективный), но есть ли другие методы, о которых я не знаю? И, чтобы быть ясным, я говорю об оптимизации кода, а не самого оборудования (это работа NVIDIA и AMD).

Как дополнительный вопрос, я знаю, что Dell и HP продают серверы Tesla. Мне интересно, насколько хорошо графический процессор использует приложение базы данных, где вам нужно постоянное чтение с жесткого диска (HDD или SSD), операция, которую может выполнять только процессор,

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы