Результаты поиска по запросу "thrust"
groups.google.com/forum/#!topic/thrust-users/nXQD6j7_xfs
аюsort_by_key с массивами ключ-значение размером 80 миллионов. Устройство являетсяGTX 560 Tiс участием2 ГбVRAM. Когда доступная (свободная) память перед sort_by_key1200MB, завершает сортировку в200ms, Но когда доступная память падает до600MB, ...
Это немного уродливо, но CUDA нужен механизм для передачи данных между RAM и GPU.
аюсь пройтиdevice_vector структур struct point { unsigned int x; unsigned int y; }к функции следующим образом: void print(thrust::device_vector<point> &points, unsigned int index) { std::cout << points[index].y << points[index].y << std::endl; ...
Подсчет вхождений чисел в массиве CUDA
У меня есть массив целых чисел без знака, хранящихся на графическом процессоре с CUDA (обычно1000000 элементы). Я хотел бы посчитать вхождение каждого числа в массиве. Есть только несколько отдельных чисел (о10), но эти цифры могут варьироваться ...
Нахождение максимального значения элемента И его положение с помощью CUDA Thrust
Как получить не только значение, но и положение максимального (минимального) элемента (res.val а такжеres.pos)? thrust::host_vector<float> h_vec(100); thrust::generate(h_vec.begin(), h_vec.end(), rand); thrust::device_vector<float> d_vec = ...
Упорная копия - мажорный столбец OutputIterator
У меня есть вектор матриц (хранится как основные массивы столбцов), который я хочу объединить по вертикали. Поэтому я хочу использовать функцию копирования из структуры Thrust, как в следующем примере фрагмента: int offset = 0; for(int i = 0; i ...
пользовательский оператор быстрого сравнения тяги CUDA
Я оцениваю CUDA и в настоящее время использую библиотеку Thrust для сортировки чисел. Я хотел бы создать свой собственный компаратор для thrust :: sort, но он значительно замедляется! Я создал свой собственныйМеньшереализация путем простого ...
Как отлаживать функции тяги cuda в visual studio 2010 с помощью параллельного nsight
Я использую Visual Studio 2010, параллельные nsight 2.2 и cuda 4.2 для обучения. Моя система Windows 8 Pro x64. Я открыл проект сортировки radix, включенный cuda computing SDK в VS, и скомпилировал его без ошибок. Код сортировки ...
Функциональный объект не работает должным образом
Я определил следующий объект функции: struct Predicate1 { __device__ bool operator () (const DereferencedIteratorTuple& lhs, const DereferencedIteratorTuple& rhs) { using thrust::get; //if you do <=, returns last occurence of largest element. ...
Как нормализовать матричные столбцы в CUDA с максимальной производительностью?
Как эффективно нормализовать матричные столбцы в CUDA? Моя матрица хранится в столбце-мажоре, и типичный размер - 2000x200. Операция может быть представлена в следующем коде Matlab. A = rand(2000,200); A = exp(A); A = A./repmat(sum(A,1), ...