Resultados de la búsqueda a petición "cuda"

1 la respuesta

Problemas para generar números primos con CUDA

Acabo de verme con Cuda, y después de repasar los tutoriales de suma de vectores aquí [https://www.nvidia.com/docs/IO/116711/sc11-cuda-c-basics.pdf]Pensé que intentaría algo desde cero para realmente poner mis piernas debajo de mí. Dicho esto, ...

1 la respuesta

¿Hay alguna forma de optimizar las llamadas sincos en CUDA?

Estoy escribiendo un programa en CUDA que hace una gran cantidad de llamadas alsincos() función, utilizando doble precisión. Me temo que este es uno de los mayores cuellos de botella del código, y no puedo reducir la cantidad de llamadas a la ...

1 la respuesta

atomicMax + AtomicCAS (atomicExch)

Me gustaría preguntarles si hay una mejor manera de combinar 2 atómicos. Mi objetivo es encontrar los resultados más altos para un conjunto de ecuaciones K (más de 32) en una lista de valores de parámetros J (una entrada de 2 vías muy similar) y ...

1 la respuesta

Cómo encontrar la suma de la matriz en CUDA por reducción

Estoy implementando una función para encontrar la suma de una matriz usando la reducción, mi matriz tiene 32 * 32 elementos y sus valores son 0 ... 1023. El valor de mi suma esperada es 523776, pero mi resultado es 15872, está mal . Aquí está mi ...

3 la respuesta

¿Cómo puedo hacer que Tensorflow se ejecute en una GPU con capacidad 2.0?

Instalé con éxito tensorflow (GPU) en Linux Ubuntu 16.04 e hice algunos pequeños cambios para que funcione con la nueva versión de Ubuntu LTS. Sin embargo, pensé (quién sabe por qué) que mi GPU cumplía con el requisito mínimo de una capacidad de ...

1 la respuesta

Encuentra max de matriz en CUDA

Acabo de empezar en CUDA. Ahora tengo una pregunta. Tengo una matriz N * N, y una escala de ventana es 8x8. Quiero subdividir esta matriz en múltiples submatrices y encontrar el valor máximo de esto. Por ejemplo, si tengo una matriz de 64 * 64, ...

1 la respuesta

¿Cómo uso otros compiladores de c ++ con CUDA en Windows?

Estoy tratando de construir una aplicación simple con CUDA y lo he intentado durante horas y no puedo hacer que funcione en Windows. nvcc se niega absolutamente a compilar sin el compilador de Visual Studio, que no admite las cosas que necesito. ...

1 la respuesta

Establecer recursos máximos de CUDA

Me pregunto si es posible establecer los recursos máximos de GPU de una aplicación CUDA. Por ejemplo, si tuviera una GPU de 4GB pero quisiera que una aplicación determinada solo pudiera acceder a 2GB, y fallara si intenta ...

3 la respuesta

Generando código de dispositivo reubicable usando Nvidia Nsight

Estoy tratando de compilar un ejemplo de paralelismo dinámico en CUDA y cuando intento compilarlo, aparece un error y dice: kernel launch from __device__ or __global__ functions requires separate compilation modes Más tarde descubrí que tengo ...

2 la respuesta

CUDA SASS a Cubin

Con CuObjDump, SASS puede generarse desde un archivo Cubin usandocuobjdump -sass <input file>Pero, ¿hay alguna forma de convertir el SASS de nuevo a Cubin?