Resultados de la búsqueda a petición "cublas"
Usando cuBLAS con números complejos de Thrust
En mi código, uso matrices con números complejos de la biblioteca de empuje y me gustaría usar cublasZgeam () para transponer la matriz. Usar números complejos de cuComplex.h no es una opción preferible ya que hago mucha aritmética en la matriz ...
Copiar una matriz de punteros en la memoria del dispositivo y viceversa (CUDA)
Estoy tratando de usarcublas funcióncublasSgemmBatched En mi ejemplo de juguete. En este ejemplo, primero asigno matrices 2D:h_AA, h_BB del tamaño [6] [5] yh_CC del tamaño [6] [1] Después de eso lo copié al dispositivo, realicécublasSgemmBatched ...
Multiplicación de vectores de matriz en CUDA: evaluación comparativa y rendimiento
Estoy actualizando mi pregunta con algunos resultados nuevos de evaluación comparativa (también reformulé la pregunta para que sea más específica y actualicé el código) ... Implementé un núcleo para la multiplicación de matriz-vector en CUDA C ...
Cuda: resolución de mínimos cuadrados, baja velocidad
Recientemente, uso Cuda para escribir un algoritmo llamado 'búsqueda de correspondencia ortogonal'. En mi código feo de Cuda, la iteración completa tarda 60 segundos, y Eigen lib tarda solo 3 segundos ... En mi código, la matriz A es [640,1024] ...
Encuentre max / min en CUDA sin pasarlo a la CPU
Necesito encontrar el índice del elemento máximo en una matriz de flotadores. Estoy usando la función "cublasIsamax", pero esto devuelve el índice ...
Convertir la octava para usar CuBLAS
Me gustaría convertir Octave para usar CuBLAS para la multiplicación de matrices. Este video parece indicar que esto es tan simple como escribir 28 caractere...
Página 1 de 2