Resultados de la búsqueda a petición "gpu-programming"

1 la respuesta

La vinculación con bibliotecas CUDA de terceros ralentiza cudaMalloc

No es un secreto que en CUDA 4.x la primera llamada a

1 la respuesta

Diferencias entre VexCL, Thrust y Boost.Compute

Con solo una comprensión superficial de estas bibliotecas, parecen ser muy similares. Sé que VexCL y Boost.Compute usan OpenCl como backend (aunque la versió...

1 la respuesta

Optimización de GPU para código vectorizado

function w=oja(X, varargin) % get the dimensionality [m n] = size(X); % random initial weights w = randn(m,1); options = struct( ... 'rate', .00005, ... 'niter', 5000, ... 'delta', .0001); options = getopt(options, varargin); success = 0; % run ...

1 la respuesta

nvidia-smi ¿Explicación de utilización de GPU volátil?

Yo sé esonvidia-smi -l 1 dará el uso de la GPU cada segundo (de manera similar a lo siguiente). Sin embargo, agradecería una explicación sobre quéVolatile GPU-Util realmente significa. ¿Es ese el número de SM usados sobre el total de SM, o la ...

1 la respuesta

Rendimiento de cudaMemcpyToSymbol

Tengo algunas funciones que cargan una variable en la memoria constante del dispositivo y lanzan una función del núcleo. Noté que la primera vez que una función carga una variable en memoria constante toma 0.6 segundos, pero las siguientes cargas ...

1 la respuesta

Cómo puede usar la función de grupos cooperativos de CUDA en Windows

Mi GPU es GeForce MX150, arquitectura pascal, CC. 6.1, CUDA 9.1, windows 10. Aunque mi GPU es pascal pero los grupos cooperativos no funcionan. Quiero usarlo para la sincronización entre bloques. Encontré que mi modo tcc no está activo. También ...

1 la respuesta

Qué ejecutan los elementos de trabajo cuando se usan condicionales en la programación de GPU?

Si tiene elementos de trabajo ejecutándose en un frente de onda y hay un condicional como: if(x){ ... } else{ .... } ¿Qué ejecutan los elementos de trabajo? ¿Es el caso mediante el cual todos los elementos de trabajo en el frente de onda ...

2 la respuesta

CUDA Thrust: reduce_por_clave solo en algunos valores de una matriz, basados ​​en valores de una matriz "clave"

Digamos que tengo dos arreglos de device_vector <byte>,

2 la respuesta

Código de OpenCL 'Error MSB3721' para Intel OpenCL SDK en Visual Studio 2010

Actualmente estoy usando la plataforma Intel OpenCL SDK para programación paralela heterogénea (OpenCL). Estoy usando Visual Studio 2010 Ultimate para esto. Mi sistema no tiene ninguna GPU. He trabajado en la plataforma CUDA SDK para la ...

2 la respuesta

Usando Java con Nvidia GPU's (cuda)

Estoy trabajando en un proyecto empresarial que se realiza en Java y necesita una gran potencia de cálculo para calcular los mercados empresariales. Matemáticas simples pero con gran cantidad de datos. Pedimos algunos Gpu de Cuda para probarlo y ...