Resultados de la búsqueda a petición "cuda"

2 la respuesta

CUDA SASS a Cubin

Con CuObjDump, SASS puede generarse desde un archivo Cubin usandocuobjdump -sass <input file>Pero, ¿hay alguna forma de convertir el SASS de nuevo a Cubin?

3 la respuesta

CUDA: detener todos los otros hilos

Tengo un problema que parece resolverse enumerando todas las soluciones posibles y luego encontrando la mejor. Para hacerlo, ideé un algoritmo de retroceso que enumera y almacena la mejor solución si se encuentra. Funciona bien hasta ...

1 la respuesta

Obteniendo error: "error de nvlink: referencia indefinida a '_ZN8Strategy8backtestEPddd'"

Recibo el siguiente error al ejecutarmake para mi aplicación CUDA (v7.5): nvlink error : Undefined reference to '_ZN8Strategy8backtestEPddd'No estoy seguro de por qué. Parece que algo está mal con mi Makefile. Aquí está: ¿alguna idea de lo que ...

1 la respuesta

¿Cómo unir una matriz float * a una textura 1D en cuda?

Estoy tratando de entender cómo usar la memoria de texturas uniéndola a una matriz lineal de dispositivos (no a un cudaArray). Mi código es simple (abajo). Tengo una matriz flotante * de 8 números que intento vincular a una textura 1D y luego, en ...

2 la respuesta

¿Por qué se bloquea mi kernel CUDA (error de inicio no especificado) con un tamaño de conjunto de datos diferente?

Tengo un núcleo para calcular diferentes elementos de una matriz, en función de su posición (diagonal o fuera de diagonal). El núcleo funciona como se espera al calcular matrices de tamaños: 14 x 14 (entiendo que esto es pequeño y no hace un uso ...

3 la respuesta

¿Cómo inicio una aplicación CUDA en Visual Studio 2010?

Pregunta directa:¿Cómo creo un proyecto simple CUDA de hello world en Visual Studio 2010? Antecedentes:He escrito núcleos CUDA. Estoy íntimamente familiarizado con los archivos .vcproj de Visual Studio 2005, retocados a mano. En VS 2005, si ...

1 la respuesta

¿Qué hay de malo en emitir como (void **) y device_array?

Ahi estaesta respuesta [https://stackoverflow.com/a/7989784/5657194]sobre otra pregunta sobre el uso decudaMalloc((void**)&device_array, num_bytes), que utilizavoid** como argumento de salida en lugar de pasar unvoid* como valor de retorno como ...

1 la respuesta

CUDA atomicAdd para error de definición de dobles

En versiones anteriores de CUDA, atomicAdd no se implementó para dobles, por lo que es común implementar esto comoaquí [https://stackoverflow.com/questions/12626096/why-has-atomicadd-not-been-implemented-for-doubles] . Con el nuevo CUDA 8 RC, me ...

1 la respuesta

Interpretación de "demasiados recursos para el lanzamiento"

Considere el siguiente código de Python: from numpy import float64 from pycuda import compiler, gpuarray import pycuda.autoinit # N > 960 is crucial! N = 961 code = """ __global__ void kern(double *v) { double a = v[0]*v[2]; double lmax = ...

1 la respuesta

¿Hay alguna forma de optimizar las llamadas sincos en CUDA?

Estoy escribiendo un programa en CUDA que hace una gran cantidad de llamadas alsincos() función, utilizando doble precisión. Me temo que este es uno de los mayores cuellos de botella del código, y no puedo reducir la cantidad de llamadas a la ...