CUDA - насколько медленнее идет передача по PCI-E?

Если я перенесу один байт из ядра CUDA в PCI-E на хост (память без копирования), насколько это медленно по сравнению с передачей чего-то вроде 200 мегабайт?

Что я хотел бы знать, так как я знаю, что передача по PCI-E медленна для ядра CUDA, это: что-то меняет, если я передаю только один байт или огромное количество данных? Или, возможно, поскольку передача памяти выполняется в "громады»передача одного байта является чрезвычайно дорогой и бесполезной в отношении передачи 200 МБ?

Ответы на вопрос(1)

Ваш ответ на вопрос