Результаты поиска по запросу "cuda"
Что такое «файл конфигурации Visual Studio», почему nvcc ищет его, почему он не может его найти, как это исправить?
Я пытаюсь скомпилировать код CUDA из командной строки, используя инструментарий CUDA версии 5.0 и компилятор Visual Studio 2010 Professional. В ответ на следующее, nvcc -c AddVectors.cu -ccbin "C:\Program Files (x86)\Microsoft Visual ...
Предлагает ли AMD OpenCL что-то похожее на CUDA GPUDirect?
NVIDIA предлагаетGPUDirect [http://developer.nvidia.com/gpudirect]уменьшить накладные расходы на передачу памяти. Мне интересно, есть ли подобная концепция для AMD / ATI? В частности: 1) избегают ли графические процессоры AMD второй передачи ...
Динамическое матричное умножение с CUDA
Идея моей простой программы, которую я пытался написать, состоит в том, чтобы получить информацию от пользователя, чтобы увидеть, насколько большой матрицы нужно умножить. Я собираюсь взять входные данные х на х, в настоящее время я не ...
Одновременное выполнение ядра CUDA с несколькими ядрами на поток
Использование разных потоков для ядер CUDA делает возможным параллельное выполнение ядра. Следовательноn ядра наn потоки теоретически могут работать одновременно, если они вписываются в аппаратное обеспечение, верно? Теперь я сталкиваюсь со ...
Копирование структуры, содержащей указатели, на устройство CUDA
Я работаю над проектом, где мне нужно, чтобы мое устройство CUDA делало вычисления на структуре, содержащей указатели. typedef struct StructA { int* arr; } StructA;Когда я выделяю память для структуры, а затем копирую ее на устройство, она будет ...
Расчет производительности CUFFT
Я использую CUFFT на блоках (N * N / p), разделенных на несколько графических процессоров, и у меня есть вопрос относительно расчета производительности. Для начала немного о том, как я это делаю: Отправлять N * N / p куски на каждый GPUПакетное ...
Нарушение производительности при вызове ядра cuda
Мне интересно, какие издержки при выполнении вызова ядра CUDA в C / C ++, такие как следующее: somekernel1<<<blocks,threads>>>(args); somekernel2<<<blocks,threads>>>(args); somekernel3<<<blocks,threads>>>(args);Причина, по которой я спрашиваю об ...
Ошибка неверного аргумента при копировании данных с устройства на хост
У меня проблемы с копированием данных с моего устройства обратно на хост. Мои данные расположены в структуре: typedef struct Array2D { double* arr; int rows; int cols; } Array2D;arr является «плоским» массивомrows а такжеcols описывает ...
Как использовать компилятор Intel C ++ с CUDA nvcc?
Я использую NVIDIA CUDA 4.1 в Microsoft Visual Studio 2008. У меня также установлен Intel Parallel Studio XE 2011. По умолчанию компилятор NVIDIA Cnvcc.exe использует компилятор C от Microsoftcl.exe скомпилировать свой C-код. Как я могу ...
Наименьший возможный полный набор исходных и пакетных файлов для создания приложения CUDA через командную строку?
Предполагать: ОС Windows 7Visual Studio Express 2010 с пакетом обновления 1 (SP1) только что установлен (и не изменяется ни с каким*.rules или что угодно)CUDA SDK установленУстановлен графический процессор SDKчистый / пустой набор ...