Результаты поиска по запросу "cuda"

1 ответ

OpenCL динамический параллелизм / порождения GPU?

CUDA 5только что был выпущен [http://nvidianews.nvidia.com/Releases/NVIDIA-Releases-CUDA-5-Making-Programming-With-World-s-Most-Pervasive-Parallel-Computing-Platform-Even-Easier-88b.aspx] и с этим возможность порождать потоки GPU из другого ...

1 ответ

отправка трехмерного массива в ядро CUDA

Я взял код, указанный в качестве ответа дляКак я могу сложить два 2d (тональных) массива, используя вложенные циклы for? [https://stackoverflow.com/questions/6137218/cuda-2d-array-problem]и попытался использовать его для 3D вместо 2D и немного ...

3 ответа

Почему cudaMalloc () использует указатель на указатель?

Например,cudaMalloc((void**)&device_array, num_bytes); Этот вопрос былспросил [https://stackoverflow.com/questions/7989039/use-of-cudamalloc-why-the-double-pointer] раньше, и ответ был "потому чтоcudaMalloc возвращает код ошибки ", но я ...

ТОП публикаций

4 ответа

Установка образцов cuda 5 в Ubuntu 12.10

Я пытаюсь установить cuda 5 образцов: Driver: Not Selected Toolkit: Not Selected Samples: Installation Failed. Missing required libraries.Но я получил эту ошибку: Missing required library libglut.soНо: frederico@zeus:~/Downloads$ sudo find / ...

2 ответа

Эквивалент cudaGetErrorString для cuBLAS?

CUDA Runtime имеет удобную функциюcudaGetErrorString(cudaError_t error) это переводит перечисление ошибки в читаемую строку.cudaGetErrorString используется вCUDA_SAFE_CALL(someCudaFunction()) макрос, который многие люди используют для обработки ...

1 ответ

Как скопировать память, выделенную в функции устройства, обратно в основную память

У меня есть программа CUDA, содержащая функцию хоста и функцию устройства Выполнить (), В функции хоста я выделяю глобальную памятьвыходкоторый затем будет передан в функцию устройства и использован для хранения адреса глобальной памяти, ...

2 ответа

Как правильно преобразовать массив глобальной памяти, используя вектор uint4 в CUDA, чтобы увеличить пропускную способность памяти?

Как правило, существует два метода для увеличения пропускной способности глобальной памяти в ядре CUDA на вычислительных возможностях 1.3 GPU; память обращается к слиянию и доступу к словам по крайней мере 4 байта. При первом методе доступ к ...

3 ответа

Проблемы, связанные с Open MPI при создании образцов CUDA 5.0 (Mac OS X ML)

Когда я пытаюсь сделать образцы CUDA 5.0, появляется ошибка: Makefile: 79:* MPI не найден, не строится простой MPI .. Стоп. Я пытался загрузить и собрать последнюю версию Open MPI, ссылающуюся на Open MPI "FAQ / Platforms / OS X /6. Как не ...

1 ответ

OpenCV 2.4.3rc и CUDA 4.2: «Ошибка OpenCV: нет поддержки графического процессора»

Я загрузил несколько скриншотов в этот альбом:http://imgur.com/a/w4jHc [http://imgur.com/a/w4jHc] Я пытаюсь запустить и запустить GPU в OpenCV в Visual Studio 2008. Я использую один из примеров кода OpenCV GPU, bgfg_segm.cpp. Однако, когда я ...

2 ответа

Параллельное тензорное произведение Кронекера на графических процессорах с использованием CUDA

Я параллельно работаю [этот файл] [1] на графическом процессоре, используя [PTX-файл с matlab parallel.gpu.CUDAkernel] [2]. Моя проблема с [тензорным произведением крон] [3] заключается в следующем. Мой код должен умножить два вектораkron(a,b) ...