Результаты поиска по запросу "gpu"

2 ответа

Как заставить уже написанную параллельную программу работать на массиве GPU?

У меня есть нейронная сеть, написанная на Erlang, и я только что купил карту GeForce GTX 260 с 240-ядерным GPU на ней. Это тривиально, чтобы использоватьCUDA [http://en.wikipedia.org/wiki/CUDA]Как клей, чтобы запустить это на видеокарте?

4 ответа

Простая оптимизация ядра CUDA

В процессе ускорения приложения у меня есть очень простое ядро, которое выполняет приведение типов, как показано ниже: __global__ void UChar2FloatKernel(float *out, unsigned char *in, int nElem){ unsigned int i = (blockIdx.x * blockDim.x) + ...

2 ответа

Как выбрать размеры сетки и блока для ядер CUDA?

Это вопрос о том, как определить сетку CUDA, размеры блоков и нитей. Это дополнительный вопрос к опубликованному здесь: https://stackoverflow.com/a/5643838/1292251 [https://stackoverflow.com/a/5643838/1292251] По этой ссылке ответ от talonmies ...

ТОП публикаций

1 ответ

отправка трехмерного массива в ядро CUDA

Я взял код, указанный в качестве ответа дляКак я могу сложить два 2d (тональных) массива, используя вложенные циклы for? [https://stackoverflow.com/questions/6137218/cuda-2d-array-problem]и попытался использовать его для 3D вместо 2D и немного ...

3 ответа

Альтернатива NV_path_rendering [закрыто]

Я только что посмотрел очень впечатляющую презентацию Siggraph 2012: http://nvidia.fullviewmedia.com/siggraph2012/ondemand/SS106.html [http://nvidia.fullviewmedia.com/siggraph2012/ondemand/SS106.html] Мой вопрос: это проприетарное расширение ...

2 ответа

Эквивалент cudaGetErrorString для cuBLAS?

CUDA Runtime имеет удобную функциюcudaGetErrorString(cudaError_t error) это переводит перечисление ошибки в читаемую строку.cudaGetErrorString используется вCUDA_SAFE_CALL(someCudaFunction()) макрос, который многие люди используют для обработки ...

1 ответ

OpenCV 2.4.3rc и CUDA 4.2: «Ошибка OpenCV: нет поддержки графического процессора»

Я загрузил несколько скриншотов в этот альбом:http://imgur.com/a/w4jHc [http://imgur.com/a/w4jHc] Я пытаюсь запустить и запустить GPU в OpenCV в Visual Studio 2008. Я использую один из примеров кода OpenCV GPU, bgfg_segm.cpp. Однако, когда я ...

2 ответа

Параллельное тензорное произведение Кронекера на графических процессорах с использованием CUDA

Я параллельно работаю [этот файл] [1] на графическом процессоре, используя [PTX-файл с matlab parallel.gpu.CUDAkernel] [2]. Моя проблема с [тензорным произведением крон] [3] заключается в следующем. Мой код должен умножить два вектораkron(a,b) ...

2 ответа

Может ли ядро CUDA вызывать функцию cublas?

Я знаю, это звучит странно, но вот мой сценарий: Мне нужно сделать матрично-матричное умножение (A (n * k) * B (k * n)), но мне нужны только диагональные элементы для оценки выходной матрицы. Я искал библиотеку cublas и не нашел функций уровня 2 ...

1 ответ

cuBLAS argmin - segfault, если вывод в память устройства?

В cuBLAS,cublasIsamin() дает argmin для массива с одинарной точностью. Вот полное объявление функции:cublasStatus_t cublasIsamin(cublasHandle_t handle, int n, const float *x, int incx, int *result) Руководство программиста cuBLAS предоставляет ...