Результаты поиска по запросу "cublas"

2 ответа

Эквивалент cudaGetErrorString для cuBLAS?

CUDA Runtime имеет удобную функциюcudaGetErrorString(cudaError_t error) это переводит перечисление ошибки в читаемую строку.cudaGetErrorString используется вCUDA_SAFE_CALL(someCudaFunction()) макрос, который многие люди используют для обработки ...

1 ответ

Копирование массива указателей в память устройства и обратно (CUDA)

Я пытаюсь использовать

1 ответ

Cuda: решение наименьших квадратов, плохая скорость

В последнее время я использую Cuda для написания алгоритма под названием «Погоня за ортогональным соответствием». В моем уродливом коде Cuda вся итерация зан...

ТОП публикаций

1 ответ

Будут ли функции ядра cublas автоматически синхронизироваться с хостом?

Просто общий вопрос о кублах. Для одного потока, если нет передачи памяти от GPU к CPU (например, cublasGetVector), будут ли функции ядра cublas (например, c...

3 ответа

Как нормализовать матричные столбцы в CUDA с максимальной производительностью?

Как эффективно нормализовать матричные столбцы в CUDA? Моя матрица хранится в столбце-мажоре, и типичный размер - 2000x200. Операция может быть представлена в следующем коде Matlab. A = rand(2000,200); A = exp(A); A = A./repmat(sum(A,1), ...

2 ответа

Эквивалент cudaGetErrorString для cuBLAS?

CUDA Runtime имеет удобную функцию

1 ответ

CUBLAS: неправильная инверсия для матрицы с нулевым шарниром

Начиная с CUDA 5.5, библиотека CUBLAS содержит подпрограммы для пакетной матричной факторизации и инверсии (

2 ответа

Матрично-векторное умножение в CUDA: бенчмаркинг и производительность

Я обновляю свой вопрос некоторыми новыми результатами бенчмаркинга (я также переформулировал вопрос, чтобы быть более конкретным, и я обновил код) ...Я реали...

2 ответа

Найти максимум / мин в CUDA, не передавая его в процессор

Мне нужно найти индекс максимального элемента в массиве с плавающей точкой. Я использую функцию "cublasIsamax», но это возвращает индекс ЦП, и это замед...

1 ответ

Ошибка сегментации при передаче указателя устройства на cublasSnrm2

Приведенный ниже код cublas дает нам ошибки: ядро ​​сбрасывается, находясь в «cublasSnrm2 (handle, row, dy, incy, de)», не могли бы вы дать совет?main.cu