Результаты поиска по запросу "cuda"

1 ответ

Постоянное использование хоста float в ядре в CUDA

Я использую CUDA 5.0. Я заметил, что компилятор позволит мне использовать объявленный хостИНТконстанты в ядрах. Однако он отказывается компилировать любые ядра, которые используют объявленные хостомпоплавокконстанты. Кто-нибудь знает причину ...

2 ответа

Запущено ли объединение для обращения к памяти в обратном порядке?

Допустим, у меня есть несколько потоков, и они обращаются к памяти по адресам A + 0, A + 4, A + 8, A + 12 (каждый доступ = следующий поток). Такой доступ объединен, верно? Однако, если у меня есть доступ к той же памяти, но в обратном порядке, ...

0 ответов

Алгоритм CUDA dijkstra [закрыто]

Кто-нибудь реализовал версию CUDA для распараллеливания алгоритма Дейкстры для данного графа разреженной матрицы (cuSPARSE), а для исходного и целевого узла найти минимальный путь K? Мне действительно нужно, чтобы решить общий граф, который я ...

ТОП публикаций

1 ответ

CUDA: функция профиля Nsight VS2010 __device__

Я хотел бы знать, как профилировать__device__ функция, которая находится внутри__global__ работать с Nsight 2.2 на visual studio 2010. Мне нужно знать, какая функция отнимает много ресурсов и времени. У меня CUDA 5.0 на CC 2.0.

1 ответ

CUDA: выделение массива указателей на изображения и изображения [закрыто]

Я новичок в CUDA. Я хочу скопировать стопку изображений на устройство. unsigned char** _devStackImagesCuda = NULL; int stackSize = 5;//should be replaced by argument to the function if(_devStackImagesCuda == NULL)\\allocate array of pointers on ...

2 ответа

уменьшение суммы вектора, когда размер не является степенью 2?

Для классического алгоритма редукции на графическом процессоре он отлично работает, если размер вектора равен степени 2. Что если это не так? В какой-то момент нам нужно будет найти сумму нечетного числа элемента. Каков наилучший способ ...

1 ответ

Как я могу переопределить ограничение времени выполнения ядра CUDA в Windows со вторичными графическими процессорами?

С сайта Nvidia это объясняет проблему тайм-аута: Q: Каково максимальное время выполнения ядра? В Windows максимальное время запуска отдельных программ на GPU составляет около 5 секунд. Превышение этого временного лимита обычно приводит к ошибке ...

5 ответов

Как я могу очистить память GPU с помощью CUDA (физический сброс недоступен)

Моя CUDA-программа потерпела крах во время выполнения, до того как память была очищена. В результате память устройства оставалась занятой. Я бегу на GTX 580, для чегоnvidia-smi --gpu-reset не поддерживается. размещениеcudaDeviceReset() в начале ...

1 ответ

добавление шага вектора медленнее на CUDA

Я пытаюсь запустить функцию добавления векторного шага в коде CUDA C ++, но для больших массивов с плавающей запятой размером 5 000 000 он работает медленнее, чем моя версия процессора. Ниже приведен соответствующий код CUDA и процессора, о ...

2 ответа

эффективный способ организации файлов cuda: .cpp .h .cu .cuh .curnel файлы

Что является наиболее простым для понимания / эффективной и т. Д. Организацией кода для cuda. После некоторого исследования я обнаружил, что объявления функций cuda должны быть в файле .cuh, а реализации находятся в файле .cu, а ...