Результаты поиска по запросу "cuda"
скомпилировать простой новый проект CUDA в Netbeans
Я создал новое приложение C ++ в Netbeans и хочу скомпилировать простой CUDA, например: #include <cstdlib> // includes, system #include <stdio.h> // includes CUDA Runtime #include <cuda_runtime.h> // includes help #include ...
Когда использовать volatile с общей памятью CUDA
При каких обстоятельствах вы должны использоватьvolatile ключевое слово с общей памятью ядра CUDA? Я это понимаюvolatile говорит компилятору никогда не кэшировать какие-либо значения, но мой вопрос касается поведения с ...
Результат эксперимента отличается от CUDA Occupancy Calculator
Я изучаю архитектуру CUDA. Я сделал некоторые из параллельной обработки кода в среде, как показано ниже. Графический процессор: GTX580 (CC 2.0) Потоки в блоке: 16x16 = 256 Регистров в потоке: 16 Общая память на блок: 48 байт Я знаю ...
cudaMemcpyToSymbol против cudaMemcpy [закрыто]
Я пытаюсь выяснить почемуcudaMemcpyToSymbolне работает для меня (НоcudaMemcpy делает.) // symbols: __constant__ float flt[480]; // 1920 bytes __constant__ int ints[160]; // 640 bytes // func code follows: float* pFlts; cudaMalloc((void**)&pFlts, ...
cudaMemcpyToSymbol использует или не использует строку
Я пытался скопировать структуру в постоянную память следующим образом: struct Foo { int a, b, c; }; __constant__ Foo cData; int main() { Foo hData = {1, 2, 3}; cudaMemcpyToSymbol(cData, &hData, sizeof(Foo)); // ... }И это работало нормально, в ...
Неполный вывод из функции printf (), вызванной на устройстве
Для тестирования вызова функции printf () на устройстве я написал простую программу, которая копирует массив среднего размера на устройство и выводит значение массива устройства на экран. Хотя массив правильно скопирован на устройство, функция ...
Использовать динамическое распределение общей памяти для двух разных векторов
В функции ядра я хочу два вектора совместной памяти, оба сsize длина (на самом делеsizeof(float)*size). Поскольку невозможно выделить память непосредственно в функции ядра, если требуется переменная, мне пришлось распределять ее динамически, ...
Какой самый эффективный способ транспонировать матрицу в CUDA?
у меня естьM*N матрицу памяти хоста, и после копирования в память устройства ее нужно переместить вN*M матрица. Есть ли какой-нибудь cuda (cuBLAS ...) API, который делает это? Я использую CUDA 4. Спасибо!
Передача программы PTX непосредственно в драйвер CUDA
API драйвера CUDA обеспечивает загрузку файла, содержащего код PTX, из файловой системы. Один обычно делает следующее: CUmodule module; CUfunction function; const char* module_file = "my_prg.ptx"; const char* kernel_name = "vector_add"; err = ...
CUDA: Как скопировать 3D-массив с хоста на устройство?
Я хочу узнать, как я могу скопировать трехмерный массив из памяти хоста в память устройства. Допустим, у меня есть 3D-массив, который содержит данные. Например, int host_data [256] [256] [256]; Я хочу скопировать эти данные в dev_data (массив ...