Resultados de la búsqueda a petición "cub"

1 la respuesta

¿Hacer CUB blockradixsort en chip por completo?

Estoy leyendo las documentaciones y ejemplos de CUB: #include <cub/cub.cuh> // or equivalently <cub/block/block_radix_sort.cuh> __global__ void ExampleKernel(...) { // Specialize BlockRadixSort for 128 threads owning 4 integer items each typedef ...

1 la respuesta

cub BlockRadixSort: ¿cómo lidiar con un gran tamaño de mosaico u ordenar múltiples mosaicos?

Cuando se usa cub :: BlockRadixSort para ordenar dentro de un bloque, si el número de elementos es demasiado grande, ¿cómo lidiamos con eso? Si configuramos un tamaño de mosaico para que sea demasiado grande, la memoria compartida para el ...

1 la respuesta

¿Por qué mi código de escaneo inclusivo es 2 veces más rápido en la CPU que en una GPU?

Escribí un breve programa de CUDA que usa elbiblioteca CUB altamente optimizada [http://nvlabs.github.io/cub]para demostrar que un núcleo de un antiguo procesador Intel Q6600 de cuatro núcleos (los cuatro supuestamente son capaces de ~ 30 GFLOPS ...