Resultados de la búsqueda a petición "cuda"
Encuentra max de matriz en CUDA
Acabo de empezar en CUDA. Ahora tengo una pregunta. Tengo una matriz N * N, y una escala de ventana es 8x8. Quiero subdividir esta matriz en múltiples submatrices y encontrar el valor máximo de esto. Por ejemplo, si tengo una matriz de 64 * 64, ...
Interfaz Fortran para llamar a una función C que devuelve un puntero
Tengo una función C double* foofunc() { /* Function Body */ }No sé cómo declarar una interfaz enFortran llamar a estoC función. Además, si se supone que un puntero apunta aGPU device memory, ¿cómo podría definir eso en elFortran ¿interfaz? ...
Problemas para generar números primos con CUDA
Acabo de verme con Cuda, y después de repasar los tutoriales de suma de vectores aquí [https://www.nvidia.com/docs/IO/116711/sc11-cuda-c-basics.pdf]Pensé que intentaría algo desde cero para realmente poner mis piernas debajo de mí. Dicho esto, ...
¿Cómo puedo hacer que Tensorflow se ejecute en una GPU con capacidad 2.0?
Instalé con éxito tensorflow (GPU) en Linux Ubuntu 16.04 e hice algunos pequeños cambios para que funcione con la nueva versión de Ubuntu LTS. Sin embargo, pensé (quién sabe por qué) que mi GPU cumplía con el requisito mínimo de una capacidad de ...
¿Cómo depurar el código del kernel CUDA usando Visual Studio 2008?
Hola, estoy usando Visual Studio 2008, con CUDA 3.2. Estoy tratando de depurar una función con esta firma: MatrixMultiplication_Kernel<<<dimGrid, dimBlock>>>(Md, Nd, Pd, Width);Puedo ingresar a la función, sin embargo, cuando entro en la ...
Lectura de una refundición uint8_t no alineada como una matriz uint32_t, sin obtener todos los valores
Estoy tratando de emitir una matriz uint8_t a la matriz uint32_t. Sin embargo, cuando trato de hacer esto, parece que no puedo acceder a cada 4 bytes consecutivos. Digamos que tengo una matriz uint8_t con 8 bytes. Me gustaría acceder al byte ...
¿Cuántos ciclos de latencia de memoria por tipo de acceso a memoria en OpenCL / CUDA?
Revisé la guía de programación y la guía de mejores prácticas y mencionó que el acceso a la memoria global demora entre 400 y 600 ciclos. No vi mucho en los otros tipos de memoria como caché de textura, caché constante, memoria compartida. Los ...
Pasando estructuras a los núcleos CUDA
Soy nuevo en CUDA C, y estoy tratando de pasar una estructura typedef'd a un kernel. Mi método funcionó bien cuando lo probé con una estructura que solo contenía ints, pero cuando cambio a flotantes obtengo números sin sentido como resultado. ...
Implementación de MySQL con CUDA
Soy un estudiante universitario con especialización en CS. En este momento estoy tomando una clase de Arquitectura de Computadores. Necesitamos hacer un proyecto. Quiero hacer algo relacionado con CUDA, donde el rendimiento de la computación ...
Consejos / recursos para proyectos de software multiplataforma a gran escala
Voy a comenzar un proyecto de software a gran escala que implica una GUI multiplataforma y un gran número de cálculos. Planeo escribir la mayor parte del back-end de la aplicación en C ++ y CUDA, y la GUI en Qt4. Planeo usar Make como mi sistema ...