Результаты поиска по запросу "cuda"

1 ответ

Разница в создании контекста CUDA

У меня есть программа, которая использует три ядра. Чтобы получить ускорения, я делал фиктивную копию памяти, чтобы создать контекст следующим образом: __global__ void warmStart(int* f) { *f = 0; }который запускается раньше, чем ядра, я хочу ...

2 ответа

не может использовать printf в функции ядра cuda

Кажется, чтоprintf не работает внутри ядра кода cuda #include "Common.h" #include<cuda.h> #include <stdio.h> __device__ __global__ void Kernel(float *a_d , float *b_d ,int size) { int idx = threadIdx.x ; int idy = threadIdx.y ; //Allocating ...

1 ответ

CUDA 5.0: замена для cutil.h?

Я хочу скомпилировать старый проект (на основе CUDA 2.3) с новым CUDA 5.0. К сожалению, в нем используется старый заголовок cutil.h, который больше не доступен в CUDA 5.0. Есть ли замена для этого заголовка? В частности, отсутствуют функции ...

ТОП публикаций

1 ответ

printf с -arch = sm_20 ничего не показывает в файле ядра

Я добавил несколько операторов printf в мою программу cuda __device__ __global__ void Kernel(float *, float * ,int ); void DeviceFunc(float *temp_h , int numvar , float *temp1_h) { ..... //Kernel call printf("calling kernel\n"); Kernel<<<dimGrid ...

1 ответ

cudaMemset () - он устанавливает байты или целые числа?

Изонлайн [http://www.clear.rice.edu/comp422/resources/cuda/html/group__CUDART__MEMORY_ge07c97b96efd09abaeb3ca3b5f8da4ee.html#ge07c97b96efd09abaeb3ca3b5f8da4ee] документация: cudaError_t cudaMemset (void * devPtr, int value, size_t count ...

2 ответа

Может ли ядро CUDA вызывать функцию cublas?

Я знаю, это звучит странно, но вот мой сценарий: Мне нужно сделать матрично-матричное умножение (A (n * k) * B (k * n)), но мне нужны только диагональные элементы для оценки выходной матрицы. Я искал библиотеку cublas и не нашел функций уровня 2 ...

1 ответ

Как отлаживать функции тяги cuda в visual studio 2010 с помощью параллельного nsight

Я использую Visual Studio 2010, параллельные nsight 2.2 и cuda 4.2 для обучения. Моя система Windows 8 Pro x64. Я открыл проект сортировки radix, включенный cuda computing SDK в VS, и скомпилировал его без ошибок. Код сортировки ...

5 ответов

Как динамически размещать массивы внутри ядра?

Мне нужно динамически распределять некоторые массивы внутри функции ядра. Как я могу это сделать? Мой код примерно такой: __global__ func(float *grid_d,int n, int nn){ int i,j; float x[n],y[nn]; //Do some really cool and heavy computations here ...

2 ответа

Cuda C - ошибка компоновщика - неопределенная ссылка

Я с трудом собираю простую программу cuda, состоящую только из двух файлов. Main.c выглядит так: #include "my_cuda.h" int main(int argc, char** argv){ dummy_gpu(); }Cuda.h выглядит так: #ifndef MY_DUMMY #define MY_DUMMY void dummy_gpu(); ...

1 ответ

время запуска истекло и было прекращено

Я использую Tesla 2075 (CC 2.0) с CUDA 4.2. Я запускаю свою программу без отображенияГПУ (Тесла)и я получаю ошибку: "the launch timed out and was terminated "Ожидается ли эта ошибка на графическом процессоре без дисплея? И как я могу отключить ...