Сохранение точечного продукта в GPGPU с использованием процедуры CUBLAS

Я пишу код для вычисления точечного произведения двух векторов, используя подпрограмму CUBLAS для точечного произведения, но она возвращает значение в памяти хоста. Я хочу использовать точечный продукт для дальнейших вычислений только на GPGPU. Как сделать так, чтобы значение находилось только в GPGPU и использовалось для дальнейших вычислений, без явного копирования из CPU в GPGPU?

Ответы на вопрос(2)

Ваш ответ на вопрос