Результаты поиска по запросу "cuda"
Разница в создании контекста CUDA
У меня есть программа, которая использует три ядра. Чтобы получить ускорения, я делал фиктивную копию памяти, чтобы создать контекст следующим образом: __global__ void warmStart(int* f) { *f = 0; }который запускается раньше, чем ядра, я хочу ...
не может использовать printf в функции ядра cuda
Кажется, чтоprintf не работает внутри ядра кода cuda #include "Common.h" #include<cuda.h> #include <stdio.h> __device__ __global__ void Kernel(float *a_d , float *b_d ,int size) { int idx = threadIdx.x ; int idy = threadIdx.y ; //Allocating ...
CUDA 5.0: замена для cutil.h?
Я хочу скомпилировать старый проект (на основе CUDA 2.3) с новым CUDA 5.0. К сожалению, в нем используется старый заголовок cutil.h, который больше не доступен в CUDA 5.0. Есть ли замена для этого заголовка? В частности, отсутствуют функции ...
printf с -arch = sm_20 ничего не показывает в файле ядра
Я добавил несколько операторов printf в мою программу cuda __device__ __global__ void Kernel(float *, float * ,int ); void DeviceFunc(float *temp_h , int numvar , float *temp1_h) { ..... //Kernel call printf("calling kernel\n"); Kernel<<<dimGrid ...
cudaMemset () - он устанавливает байты или целые числа?
Изонлайн [http://www.clear.rice.edu/comp422/resources/cuda/html/group__CUDART__MEMORY_ge07c97b96efd09abaeb3ca3b5f8da4ee.html#ge07c97b96efd09abaeb3ca3b5f8da4ee] документация: cudaError_t cudaMemset (void * devPtr, int value, size_t count ...
Может ли ядро CUDA вызывать функцию cublas?
Я знаю, это звучит странно, но вот мой сценарий: Мне нужно сделать матрично-матричное умножение (A (n * k) * B (k * n)), но мне нужны только диагональные элементы для оценки выходной матрицы. Я искал библиотеку cublas и не нашел функций уровня 2 ...
Как отлаживать функции тяги cuda в visual studio 2010 с помощью параллельного nsight
Я использую Visual Studio 2010, параллельные nsight 2.2 и cuda 4.2 для обучения. Моя система Windows 8 Pro x64. Я открыл проект сортировки radix, включенный cuda computing SDK в VS, и скомпилировал его без ошибок. Код сортировки ...
Как динамически размещать массивы внутри ядра?
Мне нужно динамически распределять некоторые массивы внутри функции ядра. Как я могу это сделать? Мой код примерно такой: __global__ func(float *grid_d,int n, int nn){ int i,j; float x[n],y[nn]; //Do some really cool and heavy computations here ...
Cuda C - ошибка компоновщика - неопределенная ссылка
Я с трудом собираю простую программу cuda, состоящую только из двух файлов. Main.c выглядит так: #include "my_cuda.h" int main(int argc, char** argv){ dummy_gpu(); }Cuda.h выглядит так: #ifndef MY_DUMMY #define MY_DUMMY void dummy_gpu(); ...
время запуска истекло и было прекращено
Я использую Tesla 2075 (CC 2.0) с CUDA 4.2. Я запускаю свою программу без отображенияГПУ (Тесла)и я получаю ошибку: "the launch timed out and was terminated "Ожидается ли эта ошибка на графическом процессоре без дисплея? И как я могу отключить ...