Результаты поиска по запросу "cuda"

1 ответ

 учебный класс. Вы должны ознакомиться с ним. Если бы вы использовали здесь экземпляр GPUarray, вы бы получили ошибки несоответствия типов, которые бы предупредили вас о точном источнике проблемы при первой попытке его запуска.

2 ответа

Однострочный ответ: если у вас есть один поток на элемент, вы платите стоимость настройки потока - как минимум, копируя аргумент из постоянной памяти в регистры - для каждого элемента, и это расточительно.

1 ответ

 привязок. По сути, нет разницы в коде, который я разместил в ответе, какой бы тип вы ни использовали.

м коде я использую массивы с комплексными числами из библиотеки Thrust, и я хотел бы использовать cublasZgeam () для транспонирования массива.Использование к...

ТОП публикаций

6 ответов

@einpoklum Я добавил сгенерированный код PTX, согласно вашему предложению.

сто читал:Эффективное деление значения без знака на степень два, округлениеи мне было интересно, какой самый быстрый способ сделать это в CUDA. Конечно, под ...

1 ответ

CUDA Снижение тяги с двумя массивами

У меня есть следующий (компилируемый и исполняемый) код с использованием CUDA Thrust для выполнения сокращенияfloat2 массивы. Работает правильно using namespace std; // includes, system #include <stdlib.h> #include <stdio.h> #include <string.h> ...

6 ответов

CUDA выделяет массив массивов

У меня есть некоторые проблемы с размещением массива массивов в CUDA. void ** data; cudaMalloc(&data, sizeof(void**)*N); // allocates without problems for(int i = 0; i < N; i++) { cudaMalloc(data + i, getSize(i) * sizeof(void*)); // seg fault is ...

2 ответа

Патви: Значит, с Лэйном все в порядке; но вы печатаете его только с полосы 0.

2 ответа

ОК, может быть, я должен сделать больше тестов, спасибо.

у использовать ffmpeg для ускорения кодирования и декодирования видео с помощью графического процессора NVIDIA.ОтСайт NVIDIA:Графические процессоры NVIDIA со...

1 ответ

Спасибо, Йоэль.

аюсь ускорить передачу данных DMA &lt;-&gt; CPU &lt;-&gt; GPU следующим образом: 1. Отображение моего (проприетарного) устройства, выделенного ядром Linux, п...

2 ответа

Медианный отбор в ядре CUDA

Мне нужно вычислить медиану массива размера p внутри ядра CUDA (в моем случае p мало, например p = 10). Я использую алгоритм O (p ^ 2) за его простоту, но за счет производительности времени. Есть ли «функция» для эффективного поиска медианы, ...