Результаты поиска по запросу "cublas"
Найти максимум / мин в CUDA, не передавая его в процессор
Мне нужно найти индекс максимального элемента в массиве с плавающей точкой. Я использую функцию "cublasIsamax», но это возвращает индекс ЦП, и это замед...
Преобразование октавы для использования CuBLAS
Я хотел бы преобразовать Octave, чтобы использовать CuBLAS для умножения матриц. Это видео, кажется, показывает, что это так же просто, как набрать 28 символов: Использование библиотеки CUDA для ускорения ...
Cuda: решение наименьших квадратов, плохая скорость
В последнее время я использую Cuda для написания алгоритма под названием «Погоня за ортогональным соответствием». В моем уродливом коде Cuda вся итерация зан...
CUBLAS: неправильная инверсия для матрицы с нулевым шарниром
Начиная с CUDA 5.5, библиотека CUBLAS содержит подпрограммы для пакетной матричной факторизации и инверсии (
Ошибка сегментации при передаче указателя устройства на cublasSnrm2
Приведенный ниже код cublas дает нам ошибки: ядро сбрасывается, находясь в «cublasSnrm2 (handle, row, dy, incy, de)», не могли бы вы дать совет?main.cu
Матрично-векторное умножение в CUDA: бенчмаркинг и производительность
Я обновляю свой вопрос некоторыми новыми результатами бенчмаркинга (я также переформулировал вопрос, чтобы быть более конкретным, и я обновил код) ...Я реали...
Копирование массива указателей в память устройства и обратно (CUDA)
Я пытаюсь использовать
thrust :: max_element медленный по сравнению cublasIsamax - более эффективная реализация?
Мне нужна быстрая и эффективная реализация для поиска индекса максимального значения в массиве в CUDA. Эту операцию необходимо выполнить несколько раз. Перво...