Результаты поиска по запросу "cuda"

1 ответ

скомпилировать простой новый проект CUDA в Netbeans

Я создал новое приложение C ++ в Netbeans и хочу скомпилировать простой CUDA, например: #include <cstdlib> // includes, system #include <stdio.h> // includes CUDA Runtime #include <cuda_runtime.h> // includes help #include ...

1 ответ

Когда использовать volatile с общей памятью CUDA

При каких обстоятельствах вы должны использоватьvolatile ключевое слово с общей памятью ядра CUDA? Я это понимаюvolatile говорит компилятору никогда не кэшировать какие-либо значения, но мой вопрос касается поведения с ...

1 ответ

Результат эксперимента отличается от CUDA Occupancy Calculator

Я изучаю архитектуру CUDA. Я сделал некоторые из параллельной обработки кода в среде, как показано ниже. Графический процессор: GTX580 (CC 2.0) Потоки в блоке: 16x16 = 256 Регистров в потоке: 16 Общая память на блок: 48 байт Я знаю ...

ТОП публикаций

1 ответ

cudaMemcpyToSymbol против cudaMemcpy [закрыто]

Я пытаюсь выяснить почемуcudaMemcpyToSymbolне работает для меня (НоcudaMemcpy делает.) // symbols: __constant__ float flt[480]; // 1920 bytes __constant__ int ints[160]; // 640 bytes // func code follows: float* pFlts; cudaMalloc((void**)&pFlts, ...

2 ответа

cudaMemcpyToSymbol использует или не использует строку

Я пытался скопировать структуру в постоянную память следующим образом: struct Foo { int a, b, c; }; __constant__ Foo cData; int main() { Foo hData = {1, 2, 3}; cudaMemcpyToSymbol(cData, &hData, sizeof(Foo)); // ... }И это работало нормально, в ...

1 ответ

Неполный вывод из функции printf (), вызванной на устройстве

Для тестирования вызова функции printf () на устройстве я написал простую программу, которая копирует массив среднего размера на устройство и выводит значение массива устройства на экран. Хотя массив правильно скопирован на устройство, функция ...

1 ответ

Использовать динамическое распределение общей памяти для двух разных векторов

В функции ядра я хочу два вектора совместной памяти, оба сsize длина (на самом делеsizeof(float)*size). Поскольку невозможно выделить память непосредственно в функции ядра, если требуется переменная, мне пришлось распределять ее динамически, ...

3 ответа

Какой самый эффективный способ транспонировать матрицу в CUDA?

у меня естьM*N матрицу памяти хоста, и после копирования в память устройства ее нужно переместить вN*M матрица. Есть ли какой-нибудь cuda (cuBLAS ...) API, который делает это? Я использую CUDA 4. Спасибо!

2 ответа

Передача программы PTX непосредственно в драйвер CUDA

API драйвера CUDA обеспечивает загрузку файла, содержащего код PTX, из файловой системы. Один обычно делает следующее: CUmodule module; CUfunction function; const char* module_file = "my_prg.ptx"; const char* kernel_name = "vector_add"; err = ...

2 ответа

CUDA: Как скопировать 3D-массив с хоста на устройство?

Я хочу узнать, как я могу скопировать трехмерный массив из памяти хоста в память устройства. Допустим, у меня есть 3D-массив, который содержит данные. Например, int host_data [256] [256] [256]; Я хочу скопировать эти данные в dev_data (массив ...