Resultados de la búsqueda a petición "cuda"
Problemas para generar números primos con CUDA
Acabo de verme con Cuda, y después de repasar los tutoriales de suma de vectores aquí [https://www.nvidia.com/docs/IO/116711/sc11-cuda-c-basics.pdf]Pensé que intentaría algo desde cero para realmente poner mis piernas debajo de mí. Dicho esto, ...
¿Hay alguna forma de optimizar las llamadas sincos en CUDA?
Estoy escribiendo un programa en CUDA que hace una gran cantidad de llamadas alsincos() función, utilizando doble precisión. Me temo que este es uno de los mayores cuellos de botella del código, y no puedo reducir la cantidad de llamadas a la ...
atomicMax + AtomicCAS (atomicExch)
Me gustaría preguntarles si hay una mejor manera de combinar 2 atómicos. Mi objetivo es encontrar los resultados más altos para un conjunto de ecuaciones K (más de 32) en una lista de valores de parámetros J (una entrada de 2 vías muy similar) y ...
Cómo encontrar la suma de la matriz en CUDA por reducción
Estoy implementando una función para encontrar la suma de una matriz usando la reducción, mi matriz tiene 32 * 32 elementos y sus valores son 0 ... 1023. El valor de mi suma esperada es 523776, pero mi resultado es 15872, está mal . Aquí está mi ...
¿Cómo puedo hacer que Tensorflow se ejecute en una GPU con capacidad 2.0?
Instalé con éxito tensorflow (GPU) en Linux Ubuntu 16.04 e hice algunos pequeños cambios para que funcione con la nueva versión de Ubuntu LTS. Sin embargo, pensé (quién sabe por qué) que mi GPU cumplía con el requisito mínimo de una capacidad de ...
Encuentra max de matriz en CUDA
Acabo de empezar en CUDA. Ahora tengo una pregunta. Tengo una matriz N * N, y una escala de ventana es 8x8. Quiero subdividir esta matriz en múltiples submatrices y encontrar el valor máximo de esto. Por ejemplo, si tengo una matriz de 64 * 64, ...
¿Cómo uso otros compiladores de c ++ con CUDA en Windows?
Estoy tratando de construir una aplicación simple con CUDA y lo he intentado durante horas y no puedo hacer que funcione en Windows. nvcc se niega absolutamente a compilar sin el compilador de Visual Studio, que no admite las cosas que necesito. ...
Establecer recursos máximos de CUDA
Me pregunto si es posible establecer los recursos máximos de GPU de una aplicación CUDA. Por ejemplo, si tuviera una GPU de 4GB pero quisiera que una aplicación determinada solo pudiera acceder a 2GB, y fallara si intenta ...
Generando código de dispositivo reubicable usando Nvidia Nsight
Estoy tratando de compilar un ejemplo de paralelismo dinámico en CUDA y cuando intento compilarlo, aparece un error y dice: kernel launch from __device__ or __global__ functions requires separate compilation modes Más tarde descubrí que tengo ...
CUDA SASS a Cubin
Con CuObjDump, SASS puede generarse desde un archivo Cubin usandocuobjdump -sass <input file>Pero, ¿hay alguna forma de convertir el SASS de nuevo a Cubin?