Resultados de la búsqueda a petición "thrust"
Cómo depurar las funciones de empuje de cuda en visual studio 2010 con nsight paralelo
Estoy usando Visual Studio 2010, Nsight 2.2 paralelo y cuda 4.2 para el aprendizaje. Mi sistema es Windows 8 Pro x64. Abrí el proyecto de clasificación de ra...
Empuje equivalente del código Open MP
El código que estoy tratando de paralelizar en mp abierto es un Monte Carlo que se reduce a algo como esto: int seed = 0; std::mt19937 rng(seed); double result = 0.0; int N = 1000; #pragma omp parallel for for(i=0; x < N; i++) { result += rng() ...
Thrust: Eliminando duplicados en matrices de valores clave
Tengo un par de matrices de igual tamaño, las llamaré claves y valores. Por ejemplo K: V 1: 99 1: 100 1: 100 1: 100 1: 103 2: 103 2: 105 3: 45 3: 67Las claves están ordenadas y los valores asociadoscon cada tecla están ordenados. Cómo ...
Empuje dentro de los núcleos escritos por el usuario
Soy un novato en Thrust. Veo que todas las presentaciones y ejemplos de Thrust solo muestran el código de host. ¿Me gustaría saber si puedo pasar un device_vector a mi propio kernel? ¿Cómo? En caso afirmativo, ¿cuáles son las operaciones ...
ocurrencia de conteo de empuje [duplicado]
Posible duplicado:Contando las ocurrencias de números en la matriz cuda¿hay una manera de usar thrust o cuda para contar la ocurrencia de los duplicados en u...
passing thrust :: device_vector a una función por referencia
Estoy tratando de pasardevice_vector de estructuras struct point { unsigned int x; unsigned int y; } a una función de la siguiente manera: void print(thrust::device_vector<point> &points, unsigned int index) { std::cout << points[index].y << ...
fast CUDA empuje operador de comparación personalizada
Estoy evaluando CUDA y actualmente estoy usando la biblioteca Thrust para ordenar números. Me gustaría crear mi propio comparador para empujar :: ordenar, ¡pero se ralentiza dramáticamente! Creé mi propiaMenomplementación de @ ...
Copia de empuje - OutputIterator columna-orden mayor
Tengo un vector de matrices (almacenadas como matrices de columnas principales) que quiero concentrar verticalmente. Por lo tanto, quiero utilizar la función...
CUDA Thrust: reduce_por_clave solo en algunos valores de una matriz, basados en valores de una matriz "clave"
Digamos que tengo dos arreglos de device_vector <byte>,