Resultados de la búsqueda a petición "cuda"

1 la respuesta

CUDA flujos y contexto

Actualmente estoy usando una aplicación que genera un montón de pthreads (linux), y cada uno de ellos crea su propio contexto CUDA. (usando cuda 3.2 en este momento). El problema que tengo es que parece que cada subproceso que tiene su ...

1 la respuesta

Medios puntos flotantes de precisión en CUDA

¿Hay algo como puntos flotantes de media precisión en CUDA? Background: quiero manipular una textura opengl usando glTexSubImage3D con datos de un PBO que genero usando CUDA. La textura se almacena en formato GL_INTENSITY16 (que es un tipo ...

2 la respuesta

¿Cómo perfilar el código PyCuda con el Visual Profiler?

Cuando creo una nueva sesión y le digo al Visual Profiler que inicie mis scripts python / pycuda, aparece el siguiente mensaje de error:Execution run #1 of program '' failed, exit code: 255 Estas son mis preferencias: Lanzamiento:python ...

1 la respuesta

CUDA Visual Profiler 'Interactive' ¿Opción de configuración X?

Recibo la siguiente advertencia al iniciar una aplicación en computeprof en Ubuntu 11.04: Los contadores seleccionados "instrucciones gld 8bit", "instrucciones gld 16bit", "instrucciones gld 32bit", "instrucciones gld 64bit", "instrucciones ...

1 la respuesta

CUDA parece haberse alcanzado el límite, pero ¿qué límite es ese?

Tengo un programa CUDA que parece estar llegando a algún tipo de límite de algún recurso, pero no puedo entender cuál es ese recurso. Aquí está la función del núcleo: __global__ void DoCheck(float2* points, int* segmentToPolylineIndexMap, ...

2 la respuesta

Caché L2 en NVIDIA Fermi

Al mirar el nombre de los contadores de rendimiento en la arquitectura NVIDIA Fermi (el archivo Compute_profiler.txt en la carpeta doc de cuda), noté que para errores de caché L2, hay dos contadores de rendimiento, l2_subp0_read_sector_misses y ...

1 la respuesta

NVIDIA Cuda error "todos los dispositivos con capacidad CUDA están ocupados o no están disponibles" en OSX

Muy a menudo, consigo que la biblioteca CUDA falle completamente y regrese con un error 46 ("todos los dispositivos con capacidad CUDA están ocupados o no están disponibles") incluso para llamadas simples como cudaMalloc. El código se ejecuta con ...

2 la respuesta

CUDA y clases

He buscado por todas partes alguna idea sobre cómo usar exactamente las clases con CUDA, y aunque existe un consenso general de que se puede hacer y aparentemente lo están haciendo las personas, me ha resultado difícil descubrir cómo realmente ...

1 la respuesta

¿Por qué CUDA Profiler indica instrucciones reproducidas: 82%! = Reproducción global + reproducción local + reproducción compartida?

Recibí información de CUDA Profiler. Estoy tan confundido por qué Replays Instruction! = Reproducción de memoria Grobal + reproducción de memoria local + reproducción de conflicto de banco compartido? Vea la siguiente información que obtuve ...

2 la respuesta

CUDA: llamando a la función de biblioteca en el kernel

Sé que existe la restricción de llamar solo__device__ funciones en el kernel. Esto me impide llamar a funciones estándar comostrcmp() y así sucesivamente en el núcleo. En este momento no puedo entender / encontrar las razones para esto. ...