Результаты поиска по запросу "cuda"

1 ответ

fmad = false дает хорошую производительность

Из примечаний к выпуску Nvidia:

2 ответа

Компиляция CUDA с лязгом

Я новичок в LLVM. Я слышал, что Clang поддерживает CUDA. Как мне скомпилировать CUDA с помощью clang? Нужно ли вносить некоторые изменения в конфигурацию или...

2 ответа

Как выбрать процессор и графический процессор для честного сравнения? [закрыто]

Мне нужно привести убедительный аргумент, что хороший графический процессор будет ценен для тех, кто должен делать определенные вычисления и может захотеть н...

ТОП публикаций

2 ответа

cuda - недостаточно памяти (проблема с потоками и блоками) - адрес находится за пределами

Я использую 63 регистра / нить, поэтому (максимум 32768) я могу использовать около 520 нитей. Сейчас я использую 512 нитей в этом примере. (Параллелизм нахо...

2 ответа

Заставить CUDA использовать регистр для переменной

У меня есть много неиспользуемых регистров в моем ядре. Я бы хотел сказать CUDA использовать несколько регистров для хранения некоторых данных, вместо того, ...

3 ответа

Как запускается ядро CUDA?

Я создал простое приложение CUDA, чтобы добавить две матрицы. Компилируется нормально. Я хочу знать, как ядро будет запущено всеми потоками и как будет прохо...

2 ответа

Преобразование thrust :: iterators в и из необработанных указателей

Я хочу использовать библиотеку Thrust для вычисления суммы префикса массива устройств в CUDA. Мой массив выделен с

1 ответ

Каким образом параллельные блоки могут работать с одним потоковым мультипроцессором GPU?

Я изучал структуру программирования CUDA, и то, что я почувствовал после изучения, так это; после создания блоков и потоков каждый из этих блоков назначается...

1 ответ

Скопировать в глобальную память, выделенную функцией malloc ()?

В руководстве по программированию CUDA говорится, что «память выделяется через

2 ответа

программа не работает для массива 30 х 30

Это программа для умножения матриц на архитектуре CUDA. Этот код работает нормально, когда размер массива равен 30 х 30, но выдает выходные данные в виде сер...