Resultados de la búsqueda a petición "cuda"

6 la respuesta

CMake Error: las variables se establecen en NOTFOUND

Instalé cuda primero usandocuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb. Ahora estoy tratando de instalarOpenCV 3.3.0 Pero recibo un error de CMake: CMake Error: The following variables are used in this project, but they are set to ...

1 la respuesta

Usando cuBLAS con números complejos de Thrust

En mi código, uso matrices con números complejos de la biblioteca de empuje y me gustaría usar cublasZgeam () para transponer la matriz. Usar números complejos de cuComplex.h no es una opción preferible ya que hago mucha aritmética en la matriz ...

1 la respuesta

Advertencia de nvcc en cuda 8.0

Recibo esta advertencia cuando intento ejecutar nvcc. Tengo cuda toolket 8.0 Tengo Nvidia GTX 480 en mi sistema. nvcc warning : The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated, and may be removed in a future release ...

1 la respuesta

Error de cudaMemcpy al copiar del dispositivo al host después de que la función del miembro de la clase __device__ altera el valor de la variable del dispositivo

Estoy confundido sobre el comportamiento del código CUDA que he escrito. Estoy en medio de pruebas de escritura para mi__device__ funciona en una clase llamadaDimmedGridGPU. Esta clase está diseñada en unint DIM y la función con la que tengo ...

2 la respuesta

¿Cuál es la forma más eficiente de calcular la identificación de deformación / identificación de carril en una cuadrícula 1-D?

En CUDA, cada subproceso conoce su índice de bloque en la cuadrícula y el índice de subproceso dentro del bloque. Pero dos valores importantes no parecen estar explícitamente disponibles para ello: Su índice como un carril dentro de su urdimbre ...

1 la respuesta

El generador de perfiles CUDA informa un acceso ineficiente a la memoria global

Tengo un kernel CUDA simple que pensé que estaba accediendo a la memoria global de manera eficiente. Sin embargo, el generador de perfiles de Nvidia informa que estoy realizando accesos de memoria global ineficientes. Mi código del ...

2 la respuesta

Procesamiento de video acelerado por GPU con ffmpeg

Quiero usar ffmpeg para acelerar la codificación y decodificación de video con una GPU NVIDIA. DeSitio web de NVIDIA [https://developer.nvidia.com/nvidia-video-codec-sdk]: Las GPU NVIDIA contienen uno o más decodificadores y codificadores ...

1 la respuesta

El registro de la memoria del dispositivo de caracteres de Linux mapeado con cudaHostRegister da como resultado un argumento no válido

Estoy tratando de aumentar la transferencia de datos DMA <-> CPU <-> GPU: 1. Mapeando mi dispositivo (propietario) Linux Kernel asignó memoria al espacio de usuario 2. Registrando el último (memoria mapeada) a Cuda con la función ...

6 la respuesta

Dividiendo eficientemente el valor sin signo por una potencia de dos, redondeando - en CUDA

Solo estaba leyendo: Dividiendo eficientemente el valor sin signo por una potencia de dos, redondeando [https://stackoverflow.com/questions/40431599/efficiently-dividing-unsigned-value-by-a-power-of-two-rounding-up] y me preguntaba cuál era la ...

2 la respuesta

¿Cuáles son los valores predeterminados para las opciones de arco y código cuando se usa nvcc?

Al compilar su código CUDA, debe seleccionar para qué arquitectura se está generando su código.nvcc proporciona dos parámetros para especificar esta arquitectura, básicamente: arch especifica la arquitectura virtual, que puede ...