Результаты поиска по запросу "cublas"

2 ответа

Найти максимум / мин в CUDA, не передавая его в процессор

Мне нужно найти индекс максимального элемента в массиве с плавающей точкой. Я использую функцию "cublasIsamax", но это возвращает индекс в ЦП, и это замедляет время работы приложения. Есть ли способ эффективно рассчитать этот индекс и сохранить ...

1 ответ

 привязок. По сути, нет разницы в коде, который я разместил в ответе, какой бы тип вы ни использовали.

м коде я использую массивы с комплексными числами из библиотеки Thrust, и я хотел бы использовать cublasZgeam () для транспонирования массива.Использование к...

1 ответ

Звони кублам в ядро

Я хочу использовать Zgemv параллельно. __global__ void S_Cphir(cuDoubleComplex *S,cuDoubleComplex *A,cuDoubleComplex *B, int n,int l) { .... cublasZgemv(handle,CUBLAS_OP_N,n,n,&alpha,S+i*n*n,n,A+n*i,1,&beta,B+i*n,1);} void ...

ТОП публикаций

2 ответа

cublasgeam был добавлен в CUBLAS5.0. Он вычисляет взвешенную сумму 2 необязательно транспонированных матриц

аюсь использовать CUBLAS для суммирования двух больших матриц неизвестного размера. Мне нужен полностью оптимизированный код (если возможно), поэтому я решил не переписывать код сложения матрицы (простой), а использовать CUBLAS, в частности ...

2 ответа

Эквивалент cudaGetErrorString для cuBLAS?

CUDA Runtime имеет удобную функциюcudaGetErrorString(cudaError_t error) это переводит перечисление ошибки в читаемую строку.cudaGetErrorString используется вCUDA_SAFE_CALL(someCudaFunction()) макрос, который многие люди используют для обработки ...

2 ответа

Может ли ядро CUDA вызывать функцию cublas?

Я знаю, это звучит странно, но вот мой сценарий: Мне нужно сделать матрично-матричное умножение (A (n * k) * B (k * n)), но мне нужны только диагональные элементы для оценки выходной матрицы. Я искал библиотеку cublas и не нашел функций уровня 2 ...

1 ответ

Будут ли функции ядра cublas автоматически синхронизироваться с хостом?

Просто общий вопрос о кублах. Для одного потока, если нет передачи памяти от GPU к CPU (например, cublasGetVector), будут ли функции ядра cublas (например, cublasDgemm) автоматически синхронизироваться с хостом? cublasDgemm(); ...

1 ответ

cuBLAS argmin - segfault, если вывод в память устройства?

В cuBLAS,cublasIsamin() дает argmin для массива с одинарной точностью. Вот полное объявление функции:cublasStatus_t cublasIsamin(cublasHandle_t handle, int n, const float *x, int incx, int *result) Руководство программиста cuBLAS предоставляет ...

3 ответа

Как нормализовать матричные столбцы в CUDA с максимальной производительностью?

Как эффективно нормализовать матричные столбцы в CUDA? Моя матрица хранится в столбце-мажоре, и типичный размер - 2000x200. Операция может быть представлена в следующем коде Matlab. A = rand(2000,200); A = exp(A); A = A./repmat(sum(A,1), ...

1 ответ

Транспонировать умножение матриц в cuBLAS howto

Проблема проста: у меня есть две матрицы, A и B, которые являются M на N, где M >> N. Я хочу сначала взять транспонирование A, а затем умножить это на B (A ^ T * B), чтобы положить это в C, который является N на N. У меня все настроено для A и B, ...