Resultados de la búsqueda a petición "cublas"

2 la respuesta

Encuentre max / min en CUDA sin pasarlo a la CPU

Necesito encontrar el índice del elemento máximo en una matriz de flotadores. Estoy usando la función "cublasIsamax", pero esto devuelve el índice ...

1 la respuesta

Llama cublas en un kernel

1 la respuesta

Usando cuBLAS con números complejos de Thrust

En mi código, uso matrices con números complejos de la biblioteca de empuje y me gustaría usar cublasZgeam () para transponer la matriz. Usar números complejos de cuComplex.h no es una opción preferible ya que hago mucha aritmética en la matriz ...

1 la respuesta

Cuda: resolución de mínimos cuadrados, baja velocidad

Recientemente, uso Cuda para escribir un algoritmo llamado 'búsqueda de correspondencia ortogonal'. En mi código feo de Cuda, la iteración completa tarda 60 segundos, y Eigen lib tarda solo 3 segundos ... En mi código, la matriz A es [640,1024] ...

2 la respuesta

Multiplicación de vectores de matriz en CUDA: evaluación comparativa y rendimiento

Estoy actualizando mi pregunta con algunos resultados nuevos de evaluación comparativa (también reformulé la pregunta para que sea más específica y actualicé el código) ... Implementé un núcleo para la multiplicación de matriz-vector en CUDA C ...

1 la respuesta

Copiar una matriz de punteros en la memoria del dispositivo y viceversa (CUDA)

Estoy tratando de usarcublas funcióncublasSgemmBatched En mi ejemplo de juguete. En este ejemplo, primero asigno matrices 2D:h_AA, h_BB del tamaño [6] [5] yh_CC del tamaño [6] [1] Después de eso lo copié al dispositivo, realicécublasSgemmBatched ...

2 la respuesta

CUBLAS - adición de matriz ... ¿cómo?

Estoy tratando de usar CUBLAS para sumar dos grandes matrices de tamaño desconocido. Necesito un código completamente optimizado (si es posible), así que decidí no reescribir el código de adición de matriz (simple) sino usar CUBLAS, en ...