Zatrzymujący produkt dot na GPGPU z wykorzystaniem procedury CUBLAS

Piszę kod do obliczania iloczynu kropkowego dwóch wektorów przy użyciu procedury CUBLAS dot produktu, ale zwraca wartość w pamięci hosta. Chcę używać produktu dot do dalszego obliczania tylko GPGPU. W jaki sposób mogę wprowadzić wartość tylko na GPGPU i używać jej do dalszych obliczeń bez tworzenia jawnej kopii z CPU do GPGPU?

questionAnswers(2)

yourAnswerToTheQuestion