Resultados de la búsqueda a petición "gpu-programming"
La vinculación con bibliotecas CUDA de terceros ralentiza cudaMalloc
No es un secreto que en CUDA 4.x la primera llamada a
Diferencias entre VexCL, Thrust y Boost.Compute
Con solo una comprensión superficial de estas bibliotecas, parecen ser muy similares. Sé que VexCL y Boost.Compute usan OpenCl como backend (aunque la versió...
Optimización de GPU para código vectorizado
function w=oja(X, varargin) % get the dimensionality [m n] = size(X); % random initial weights w = randn(m,1); options = struct( ... 'rate', .00005, ... 'niter', 5000, ... 'delta', .0001); options = getopt(options, varargin); success = 0; % run ...
nvidia-smi ¿Explicación de utilización de GPU volátil?
Yo sé esonvidia-smi -l 1 dará el uso de la GPU cada segundo (de manera similar a lo siguiente). Sin embargo, agradecería una explicación sobre quéVolatile GPU-Util realmente significa. ¿Es ese el número de SM usados sobre el total de SM, o la ...
Rendimiento de cudaMemcpyToSymbol
Tengo algunas funciones que cargan una variable en la memoria constante del dispositivo y lanzan una función del núcleo. Noté que la primera vez que una función carga una variable en memoria constante toma 0.6 segundos, pero las siguientes cargas ...
Cómo puede usar la función de grupos cooperativos de CUDA en Windows
Mi GPU es GeForce MX150, arquitectura pascal, CC. 6.1, CUDA 9.1, windows 10. Aunque mi GPU es pascal pero los grupos cooperativos no funcionan. Quiero usarlo para la sincronización entre bloques. Encontré que mi modo tcc no está activo. También ...
Qué ejecutan los elementos de trabajo cuando se usan condicionales en la programación de GPU?
Si tiene elementos de trabajo ejecutándose en un frente de onda y hay un condicional como: if(x){ ... } else{ .... } ¿Qué ejecutan los elementos de trabajo? ¿Es el caso mediante el cual todos los elementos de trabajo en el frente de onda ...
CUDA Thrust: reduce_por_clave solo en algunos valores de una matriz, basados en valores de una matriz "clave"
Digamos que tengo dos arreglos de device_vector <byte>,
Código de OpenCL 'Error MSB3721' para Intel OpenCL SDK en Visual Studio 2010
Actualmente estoy usando la plataforma Intel OpenCL SDK para programación paralela heterogénea (OpenCL). Estoy usando Visual Studio 2010 Ultimate para esto. Mi sistema no tiene ninguna GPU. He trabajado en la plataforma CUDA SDK para la ...
Usando Java con Nvidia GPU's (cuda)
Estoy trabajando en un proyecto empresarial que se realiza en Java y necesita una gran potencia de cálculo para calcular los mercados empresariales. Matemáticas simples pero con gran cantidad de datos. Pedimos algunos Gpu de Cuda para probarlo y ...
Página 1 de 2