Resultados de la búsqueda a petición "cuda"
CUDA flujos y contexto
Actualmente estoy usando una aplicación que genera un montón de pthreads (linux), y cada uno de ellos crea su propio contexto CUDA. (usando cuda 3.2 en este momento). El problema que tengo es que parece que cada subproceso que tiene su ...
Medios puntos flotantes de precisión en CUDA
¿Hay algo como puntos flotantes de media precisión en CUDA? Background: quiero manipular una textura opengl usando glTexSubImage3D con datos de un PBO que genero usando CUDA. La textura se almacena en formato GL_INTENSITY16 (que es un tipo ...
¿Cómo perfilar el código PyCuda con el Visual Profiler?
Cuando creo una nueva sesión y le digo al Visual Profiler que inicie mis scripts python / pycuda, aparece el siguiente mensaje de error:Execution run #1 of program '' failed, exit code: 255 Estas son mis preferencias: Lanzamiento:python ...
CUDA Visual Profiler 'Interactive' ¿Opción de configuración X?
Recibo la siguiente advertencia al iniciar una aplicación en computeprof en Ubuntu 11.04: Los contadores seleccionados "instrucciones gld 8bit", "instrucciones gld 16bit", "instrucciones gld 32bit", "instrucciones gld 64bit", "instrucciones ...
CUDA parece haberse alcanzado el límite, pero ¿qué límite es ese?
Tengo un programa CUDA que parece estar llegando a algún tipo de límite de algún recurso, pero no puedo entender cuál es ese recurso. Aquí está la función del núcleo: __global__ void DoCheck(float2* points, int* segmentToPolylineIndexMap, ...
Caché L2 en NVIDIA Fermi
Al mirar el nombre de los contadores de rendimiento en la arquitectura NVIDIA Fermi (el archivo Compute_profiler.txt en la carpeta doc de cuda), noté que para errores de caché L2, hay dos contadores de rendimiento, l2_subp0_read_sector_misses y ...
NVIDIA Cuda error "todos los dispositivos con capacidad CUDA están ocupados o no están disponibles" en OSX
Muy a menudo, consigo que la biblioteca CUDA falle completamente y regrese con un error 46 ("todos los dispositivos con capacidad CUDA están ocupados o no están disponibles") incluso para llamadas simples como cudaMalloc. El código se ejecuta con ...
CUDA y clases
He buscado por todas partes alguna idea sobre cómo usar exactamente las clases con CUDA, y aunque existe un consenso general de que se puede hacer y aparentemente lo están haciendo las personas, me ha resultado difícil descubrir cómo realmente ...
¿Por qué CUDA Profiler indica instrucciones reproducidas: 82%! = Reproducción global + reproducción local + reproducción compartida?
Recibí información de CUDA Profiler. Estoy tan confundido por qué Replays Instruction! = Reproducción de memoria Grobal + reproducción de memoria local + reproducción de conflicto de banco compartido? Vea la siguiente información que obtuve ...
CUDA: llamando a la función de biblioteca en el kernel
Sé que existe la restricción de llamar solo__device__ funciones en el kernel. Esto me impide llamar a funciones estándar comostrcmp() y así sucesivamente en el núcleo. En este momento no puedo entender / encontrar las razones para esto. ...