Результаты поиска по запросу "thrust"

1 ответ

groups.google.com/forum/#!topic/thrust-users/nXQD6j7_xfs

аюsort_by_key с массивами ключ-значение размером 80 миллионов. Устройство являетсяGTX 560 Tiс участием2 ГбVRAM. Когда доступная (свободная) память перед sort_by_key1200MB, завершает сортировку в200ms, Но когда доступная память падает до600MB, ...

2 ответа

Это немного уродливо, но CUDA нужен механизм для передачи данных между RAM и GPU.

аюсь пройтиdevice_vector структур struct point { unsigned int x; unsigned int y; }к функции следующим образом: void print(thrust::device_vector<point> &points, unsigned int index) { std::cout << points[index].y << points[index].y << std::endl; ...

1 ответ

Подсчет вхождений чисел в массиве CUDA

У меня есть массив целых чисел без знака, хранящихся на графическом процессоре с CUDA (обычно1000000 элементы). Я хотел бы посчитать вхождение каждого числа в массиве. Есть только несколько отдельных чисел (о10), но эти цифры могут варьироваться ...

ТОП публикаций

2 ответа

Нахождение максимального значения элемента И его положение с помощью CUDA Thrust

Как получить не только значение, но и положение максимального (минимального) элемента (res.val а такжеres.pos)? thrust::host_vector<float> h_vec(100); thrust::generate(h_vec.begin(), h_vec.end(), rand); thrust::device_vector<float> d_vec = ...

1 ответ

Упорная копия - мажорный столбец OutputIterator

У меня есть вектор матриц (хранится как основные массивы столбцов), который я хочу объединить по вертикали. Поэтому я хочу использовать функцию копирования из структуры Thrust, как в следующем примере фрагмента: int offset = 0; for(int i = 0; i ...

1 ответ

пользовательский оператор быстрого сравнения тяги CUDA

Я оцениваю CUDA и в настоящее время использую библиотеку Thrust для сортировки чисел. Я хотел бы создать свой собственный компаратор для thrust :: sort, но он значительно замедляется! Я создал свой собственныйМеньшереализация путем простого ...

1 ответ

Как отлаживать функции тяги cuda в visual studio 2010 с помощью параллельного nsight

Я использую Visual Studio 2010, параллельные nsight 2.2 и cuda 4.2 для обучения. Моя система Windows 8 Pro x64. Я открыл проект сортировки radix, включенный cuda computing SDK в VS, и скомпилировал его без ошибок. Код сортировки ...

1 ответ

Функциональный объект не работает должным образом

Я определил следующий объект функции: struct Predicate1 { __device__ bool operator () (const DereferencedIteratorTuple& lhs, const DereferencedIteratorTuple& rhs) { using thrust::get; //if you do <=, returns last occurence of largest element. ...

3 ответа

Как нормализовать матричные столбцы в CUDA с максимальной производительностью?

Как эффективно нормализовать матричные столбцы в CUDA? Моя матрица хранится в столбце-мажоре, и типичный размер - 2000x200. Операция может быть представлена в следующем коде Matlab. A = rand(2000,200); A = exp(A); A = A./repmat(sum(A,1), ...