Resultados de la búsqueda a petición "cuda"
CMake Error: las variables se establecen en NOTFOUND
Instalé cuda primero usandocuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb. Ahora estoy tratando de instalarOpenCV 3.3.0 Pero recibo un error de CMake: CMake Error: The following variables are used in this project, but they are set to ...
Usando cuBLAS con números complejos de Thrust
En mi código, uso matrices con números complejos de la biblioteca de empuje y me gustaría usar cublasZgeam () para transponer la matriz. Usar números complejos de cuComplex.h no es una opción preferible ya que hago mucha aritmética en la matriz ...
Advertencia de nvcc en cuda 8.0
Recibo esta advertencia cuando intento ejecutar nvcc. Tengo cuda toolket 8.0 Tengo Nvidia GTX 480 en mi sistema. nvcc warning : The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated, and may be removed in a future release ...
Error de cudaMemcpy al copiar del dispositivo al host después de que la función del miembro de la clase __device__ altera el valor de la variable del dispositivo
Estoy confundido sobre el comportamiento del código CUDA que he escrito. Estoy en medio de pruebas de escritura para mi__device__ funciona en una clase llamadaDimmedGridGPU. Esta clase está diseñada en unint DIM y la función con la que tengo ...
¿Cuál es la forma más eficiente de calcular la identificación de deformación / identificación de carril en una cuadrícula 1-D?
En CUDA, cada subproceso conoce su índice de bloque en la cuadrícula y el índice de subproceso dentro del bloque. Pero dos valores importantes no parecen estar explícitamente disponibles para ello: Su índice como un carril dentro de su urdimbre ...
El generador de perfiles CUDA informa un acceso ineficiente a la memoria global
Tengo un kernel CUDA simple que pensé que estaba accediendo a la memoria global de manera eficiente. Sin embargo, el generador de perfiles de Nvidia informa que estoy realizando accesos de memoria global ineficientes. Mi código del ...
Procesamiento de video acelerado por GPU con ffmpeg
Quiero usar ffmpeg para acelerar la codificación y decodificación de video con una GPU NVIDIA. DeSitio web de NVIDIA [https://developer.nvidia.com/nvidia-video-codec-sdk]: Las GPU NVIDIA contienen uno o más decodificadores y codificadores ...
El registro de la memoria del dispositivo de caracteres de Linux mapeado con cudaHostRegister da como resultado un argumento no válido
Estoy tratando de aumentar la transferencia de datos DMA <-> CPU <-> GPU: 1. Mapeando mi dispositivo (propietario) Linux Kernel asignó memoria al espacio de usuario 2. Registrando el último (memoria mapeada) a Cuda con la función ...
Dividiendo eficientemente el valor sin signo por una potencia de dos, redondeando - en CUDA
Solo estaba leyendo: Dividiendo eficientemente el valor sin signo por una potencia de dos, redondeando [https://stackoverflow.com/questions/40431599/efficiently-dividing-unsigned-value-by-a-power-of-two-rounding-up] y me preguntaba cuál era la ...
¿Cuáles son los valores predeterminados para las opciones de arco y código cuando se usa nvcc?
Al compilar su código CUDA, debe seleccionar para qué arquitectura se está generando su código.nvcc proporciona dos parámetros para especificar esta arquitectura, básicamente: arch especifica la arquitectura virtual, que puede ...