Resultados de la búsqueda a petición "cuda"

1 la respuesta

¿Salir temprano de un hilo interrumpe la sincronización entre hilos CUDA en un bloque? [duplicar

Esta pregunta ya tiene una respuesta aquí: ¿Puedo usar __syncthreads () después de haber soltado hilos? [/questions/6666382/can-i-use-syncthreads-after-having-dropped-threads] 2 respuestas Estoy implementando un cierto algoritmo de procesamiento ...

1 la respuesta

thrust :: device_vector en CUDA [duplicado]

Esta pregunta ya tiene una respuesta aquí: Empuje dentro de los núcleos escritos por el usuario [/questions/5510715/thrust-inside-user-written-kernels] 4 respuestas Soy nuevo en CUDA y estoy tratando de aprender el uso. Puede ayudarme alguien, ...

1 la respuesta

¿Puede una tarjeta Compute Capability 3.0 ejecutar Tensorflow 1.8 tensorflow-gpu runtime?

A través del tutorial de instalación para Linux (Tensorflow 1.8) y no estoy seguro de cómo interpretar la frase: arjeta @GPU con CUDA Compute Capability 3.0 o superior para construir desde la fuente y 3.5 o superior para nuestros binarios. ...

4 la respuesta

En CUDA, ¿qué es la fusión de memoria y cómo se logra?

¿Qué se "fusionó" en la transacción de memoria global de CUDA? No pude entender incluso después de leer mi guía CUDA. ¿Cómo hacerlo? En el ejemplo de matriz de guía de programación de CUDA, el acceso a la matriz fila por fila se llama "unido" o ...

4 la respuesta

¿Qué combinaciones de versiones de TensorFlow y CUDA son compatibles?

He notado que algunas versiones más nuevas de TensorFlow son incompatibles con versiones anteriores de CUDA y cuDNN. ¿Existe una descripción general de las versiones compatibles o incluso una lista de combinaciones probadas oficialmente? No puedo ...

1 la respuesta

__shfl_down y __shfl_down_sync dan resultados diferentes

Estoy confundido por __shfl_down y __shfl_down_sync, dan diferentes resultados. __global__ void shufledown1(double* a, double *b,double *c, int N) { double temp = 2.0; __syncthreads(); for (int offset = 32/2; offset > 0; offset /= ...

1 la respuesta

¿El rendimiento de Nvidia Cuda warp Scheduler rinde?

He pasado porCuda guía de programación [http://developer.download.nvidia.com/compute/cuda/3_2_prod/toolkit/docs/CUDA_C_Programming_Guide.pdf] pero aún no está claro si una deformación cederá a favor de otra deformación lista para ejecutar? ...

1 la respuesta

¿Cómo obtener el directorio CUDA incluido en objetivos C ++ con CMake nativo-CUDA-support?

En CMake versión 3.8, se introdujo el soporte nativo para CUDA como idioma. Cuando un proyecto tiene CUDA como uno de sus idiomas, CMake procederá a localizar CUDA (por ejemplo, localiza el binario nvcc). Siempre y cuando solo compiles código ...

2 la respuesta

CUDA compilador (nvcc) macro

¿Existe una macro #define compiler (nvcc) de CUDA que pueda usar? (Como _WIN32 para Windows, etc.) Necesito esto para el código de encabezado que será común entre los compiladores nvcc y VC ++. Sé que puedo seguir adelante y definir el mío ...

1 la respuesta

CUDA & Visual Studio 2008: Problemas al intentar vincular diferentes proyectos

Mientras buscaba en la red una respuesta a mi problema, he visto varias publicaciones en foros y blogs que abordan el tema "¿Cómo configuro, compilo, enlazo y ejecuto un proyecto CUDA en VIsual Studio 2008" (Estaba tratando de dar los enlaces ...