Resultados de la búsqueda a petición "cuda"

1 la respuesta

Cómo puede usar la función de grupos cooperativos de CUDA en Windows

Mi GPU es GeForce MX150, arquitectura pascal, CC. 6.1, CUDA 9.1, windows 10. Aunque mi GPU es pascal pero los grupos cooperativos no funcionan. Quiero usarlo para la sincronización entre bloques. Encontré que mi modo tcc no está activo. También ...

1 la respuesta

thrust establece la diferencia no se compila con la llamada a una función __host__ desde una función __host__ __device__ no está permitido

Tengo dos conjuntos A y B de 20 y 10 enteros respectivamente. B es un subconjunto de A. Necesito encontrar el conjunto complementario de B. Uso thrust :: set_difference para encontrar la diferencia de conjunto. Sin embargo, no se compila con el ...

1 la respuesta

CUDA HOME en la instalación de pytorch

I instalé pytorch a través de conda con cuda 7.5 conda install pytorch=0.3.0 cuda75 -c pytorch >>> import torch >>> torch.cuda.is_available() TrueNo hice ninguna otra instalación para cuda que no sea esta, ya que parece que pytorch viene con ...

1 la respuesta

¿Cómo obtener el directorio CUDA incluido en objetivos C ++ con CMake nativo-CUDA-support?

En CMake versión 3.8, se introdujo el soporte nativo para CUDA como idioma. Cuando un proyecto tiene CUDA como uno de sus idiomas, CMake procederá a localizar CUDA (por ejemplo, localiza el binario nvcc). Siempre y cuando solo compiles código ...

1 la respuesta

__shfl_down y __shfl_down_sync dan resultados diferentes

Estoy confundido por __shfl_down y __shfl_down_sync, dan diferentes resultados. __global__ void shufledown1(double* a, double *b,double *c, int N) { double temp = 2.0; __syncthreads(); for (int offset = 32/2; offset > 0; offset /= ...

4 la respuesta

¿Qué combinaciones de versiones de TensorFlow y CUDA son compatibles?

He notado que algunas versiones más nuevas de TensorFlow son incompatibles con versiones anteriores de CUDA y cuDNN. ¿Existe una descripción general de las versiones compatibles o incluso una lista de combinaciones probadas oficialmente? No puedo ...

1 la respuesta

¿Puede una tarjeta Compute Capability 3.0 ejecutar Tensorflow 1.8 tensorflow-gpu runtime?

A través del tutorial de instalación para Linux (Tensorflow 1.8) y no estoy seguro de cómo interpretar la frase: arjeta @GPU con CUDA Compute Capability 3.0 o superior para construir desde la fuente y 3.5 o superior para nuestros binarios. ...

1 la respuesta

El bucle sobre los datos en el kernel CUDA hace que la aplicación se cancele

problema: A medida que aumento la cantidad de datos que se procesan dentro del bucle que está dentro deCUDA kernel - ¡causa que la aplicación se cancele! excepción: ManagedCuda.CudaException: 'ErrorLaunchFailed: se produjo una excepción en ...

1 la respuesta

Rendimiento de cudaMemcpyToSymbol

Tengo algunas funciones que cargan una variable en la memoria constante del dispositivo y lanzan una función del núcleo. Noté que la primera vez que una función carga una variable en memoria constante toma 0.6 segundos, pero las siguientes cargas ...

1 la respuesta

¿Cómo pasar una matriz de vectores al núcleo de Cuda?

Ahora tengo thrust::device_vector<int> A[N];y mi función kernel __global__ void kernel(...) { auto a = A[threadIdx.x]; }Sé que a través de thrust :: raw_pointer_cast podría pasar un device_vector al kernel. Pero, ¿cómo podría pasarle una matriz ...