Результаты поиска по запросу "cuda"
привязок. По сути, нет разницы в коде, который я разместил в ответе, какой бы тип вы ни использовали.
м коде я использую массивы с комплексными числами из библиотеки Thrust, и я хотел бы использовать cublasZgeam () для транспонирования массива.Использование к...
@einpoklum Я добавил сгенерированный код PTX, согласно вашему предложению.
сто читал:Эффективное деление значения без знака на степень два, округлениеи мне было интересно, какой самый быстрый способ сделать это в CUDA. Конечно, под ...
CUDA Снижение тяги с двумя массивами
У меня есть следующий (компилируемый и исполняемый) код с использованием CUDA Thrust для выполнения сокращенияfloat2 массивы. Работает правильно using namespace std; // includes, system #include <stdlib.h> #include <stdio.h> #include <string.h> ...
CUDA выделяет массив массивов
У меня есть некоторые проблемы с размещением массива массивов в CUDA. void ** data; cudaMalloc(&data, sizeof(void**)*N); // allocates without problems for(int i = 0; i < N; i++) { cudaMalloc(data + i, getSize(i) * sizeof(void*)); // seg fault is ...
ОК, может быть, я должен сделать больше тестов, спасибо.
у использовать ffmpeg для ускорения кодирования и декодирования видео с помощью графического процессора NVIDIA.ОтСайт NVIDIA:Графические процессоры NVIDIA со...
Спасибо, Йоэль.
аюсь ускорить передачу данных DMA <-> CPU <-> GPU следующим образом: 1. Отображение моего (проприетарного) устройства, выделенного ядром Linux, п...
Медианный отбор в ядре CUDA
Мне нужно вычислить медиану массива размера p внутри ядра CUDA (в моем случае p мало, например p = 10). Я использую алгоритм O (p ^ 2) за его простоту, но за счет производительности времени. Есть ли «функция» для эффективного поиска медианы, ...