Результаты поиска по запросу "cublas"

3 ответа

Как нормализовать матричные столбцы в CUDA с максимальной производительностью?

Как эффективно нормализовать матричные столбцы в CUDA? Моя матрица хранится в столбце-мажоре, и типичный размер - 2000x200. Операция может быть представлена в следующем коде Matlab. A = rand(2000,200); A = exp(A); A = A./repmat(sum(A,1), ...

3 ответа

Преобразование октавы для использования CuBLAS

Я хотел бы преобразовать Octave, чтобы использовать CuBLAS для умножения матриц. Это видео, кажется, показывает, что это так же просто, как набрать 28 символов: Использование библиотеки CUDA для ускорения ...

1 ответ

 привязок. По сути, нет разницы в коде, который я разместил в ответе, какой бы тип вы ни использовали.

м коде я использую массивы с комплексными числами из библиотеки Thrust, и я хотел бы использовать cublasZgeam () для транспонирования массива.Использование к...

ТОП публикаций

2 ответа

Найти максимум / мин в CUDA, не передавая его в процессор

Мне нужно найти индекс максимального элемента в массиве с плавающей точкой. Я использую функцию "cublasIsamax», но это возвращает индекс ЦП, и это замед...

3 ответа

Какой самый эффективный способ транспонировать матрицу в CUDA?

у меня естьM*N матрицу памяти хоста, и после копирования в память устройства ее нужно переместить вN*M матрица. Есть ли какой-нибудь cuda (cuBLAS ...) API, который делает это? Я использую CUDA 4. Спасибо!

1 ответ

Будут ли функции ядра cublas автоматически синхронизироваться с хостом?

Просто общий вопрос о кублах. Для одного потока, если нет передачи памяти от GPU к CPU (например, cublasGetVector), будут ли функции ядра cublas (например, c...

1 ответ

Звони кублам в ядро

Я хочу использовать Zgemv параллельно. __global__ void S_Cphir(cuDoubleComplex *S,cuDoubleComplex *A,cuDoubleComplex *B, int n,int l) { .... cublasZgemv(handle,CUBLAS_OP_N,n,n,&alpha,S+i*n*n,n,A+n*i,1,&beta,B+i*n,1);} void ...

2 ответа

Сохранение точечного продукта в GPGPU с использованием процедуры CUBLAS

2 ответа

Эквивалент cudaGetErrorString для cuBLAS?

CUDA Runtime имеет удобную функциюcudaGetErrorString(cudaError_t error) это переводит перечисление ошибки в читаемую строку.cudaGetErrorString используется вCUDA_SAFE_CALL(someCudaFunction()) макрос, который многие люди используют для обработки ...

1 ответ

Cuda: решение наименьших квадратов, плохая скорость

В последнее время я использую Cuda для написания алгоритма под названием «Погоня за ортогональным соответствием». В моем уродливом коде Cuda вся итерация зан...