Результаты поиска по запросу "cuda"
fmad = false дает хорошую производительность
Из примечаний к выпуску Nvidia:
Компиляция CUDA с лязгом
Я новичок в LLVM. Я слышал, что Clang поддерживает CUDA. Как мне скомпилировать CUDA с помощью clang? Нужно ли вносить некоторые изменения в конфигурацию или...
Как выбрать процессор и графический процессор для честного сравнения? [закрыто]
Мне нужно привести убедительный аргумент, что хороший графический процессор будет ценен для тех, кто должен делать определенные вычисления и может захотеть н...
cuda - недостаточно памяти (проблема с потоками и блоками) - адрес находится за пределами
Я использую 63 регистра / нить, поэтому (максимум 32768) я могу использовать около 520 нитей. Сейчас я использую 512 нитей в этом примере. (Параллелизм нахо...
Заставить CUDA использовать регистр для переменной
У меня есть много неиспользуемых регистров в моем ядре. Я бы хотел сказать CUDA использовать несколько регистров для хранения некоторых данных, вместо того, ...
Как запускается ядро CUDA?
Я создал простое приложение CUDA, чтобы добавить две матрицы. Компилируется нормально. Я хочу знать, как ядро будет запущено всеми потоками и как будет прохо...
Преобразование thrust :: iterators в и из необработанных указателей
Я хочу использовать библиотеку Thrust для вычисления суммы префикса массива устройств в CUDA. Мой массив выделен с
Каким образом параллельные блоки могут работать с одним потоковым мультипроцессором GPU?
Я изучал структуру программирования CUDA, и то, что я почувствовал после изучения, так это; после создания блоков и потоков каждый из этих блоков назначается...
Скопировать в глобальную память, выделенную функцией malloc ()?
В руководстве по программированию CUDA говорится, что «память выделяется через
программа не работает для массива 30 х 30
Это программа для умножения матриц на архитектуре CUDA. Этот код работает нормально, когда размер массива равен 30 х 30, но выдает выходные данные в виде сер...