Resultados de la búsqueda a petición "cublas"

1 la respuesta

Usando cuBLAS con números complejos de Thrust

En mi código, uso matrices con números complejos de la biblioteca de empuje y me gustaría usar cublasZgeam () para transponer la matriz. Usar números complejos de cuComplex.h no es una opción preferible ya que hago mucha aritmética en la matriz ...

1 la respuesta

cuBLAS argmin - segfault si se envía a la memoria del dispositivo?

En cuBLAS,

2 la respuesta

Encuentre max / min en CUDA sin pasarlo a la CPU

Necesito encontrar el índice del elemento máximo en una matriz de flotadores. Estoy usando la función "cublasIsamax", pero esto devuelve el índice ...

1 la respuesta

Copiar una matriz de punteros en la memoria del dispositivo y viceversa (CUDA)

Estoy tratando de usarcublas funcióncublasSgemmBatched En mi ejemplo de juguete. En este ejemplo, primero asigno matrices 2D:h_AA, h_BB del tamaño [6] [5] yh_CC del tamaño [6] [1] Después de eso lo copié al dispositivo, realicécublasSgemmBatched ...

2 la respuesta

Multiplicación de vectores de matriz en CUDA: evaluación comparativa y rendimiento

Estoy actualizando mi pregunta con algunos resultados nuevos de evaluación comparativa (también reformulé la pregunta para que sea más específica y actualicé el código) ... Implementé un núcleo para la multiplicación de matriz-vector en CUDA C ...

2 la respuesta

¿Podría un núcleo CUDA llamar a una función de cublas?

2 la respuesta

¿Equivalente de cudaGetErrorString para cuBLAS?

El tiempo de ejecución CUDA tiene una función de conveniencia

2 la respuesta

Retención del producto de puntos en GPGPU utilizando la rutina CUBLAS

3 la respuesta

¿Cómo normalizar columnas matriciales en CUDA con el máximo rendimiento?

1 la respuesta

Cuda: resolución de mínimos cuadrados, baja velocidad

Recientemente, uso Cuda para escribir un algoritmo llamado 'búsqueda de correspondencia ortogonal'. En mi código feo de Cuda, la iteración completa tarda 60 segundos, y Eigen lib tarda solo 3 segundos ... En mi código, la matriz A es [640,1024] ...