Результаты поиска по запросу "cuda"

1 ответ

Я думаю, что в большинстве случаев конфликты совместно используемых банков играют основную часть повторов, затем глобальные повторы памяти, затем другие конфликты, такие как постоянные конфликты памяти, пропуски кэша команд и т. Д. К сожалению, официальной информации об этом нет.

учил информацию от CUDA Profiler. Я так растерялся, почему Replays Instruction! = Воспроизведение памяти Grobal + воспроизведение локальной памяти + воспроизведение конфликта общего банка? Смотрите следующую информацию, которую я получил от ...

1 ответ

Для каких размеров обычная загрузка и сохранение в глобальной памяти в CUDA atomic?

Являются ли общие операции чтения и записи в глобальной памяти атомарными в CUDA, если: Это 4-х байтовая инструкция? (Я предполагаю, что да)Это 8-байтовая или 16-байтовая инструкция? (Я предполагаю, что да)По крайней мере, на Кеплере и Ферми ...

2 ответа

Генерация перестановок с помощью CUDA

Я читал о CUDA и пытался реализовать простой код, чтобы создать все возможные перестановкиarray {a,b,c,d}, но я не знаю, как реализовать способ CUDA (так как все примеры, которые я прочитал, имели видa[blockIdx.x] = b[blockIdx.x] + c[blockIdx.x] ...

ТОП публикаций

2 ответа

 не были скомпилированы для архитектуры CUDA. Я не видел никаких стандартных библиотек C для CUDA.

ю, что есть ограничение, чтобы звонить только__device__ функции в ядре. Это мешает мне вызывать стандартные функции, такие какstrcmp() и так далее в ядре. На данный момент я не могу понять / найти причины для этого. Не мог ли компилятор просто ...

1 ответ

Можно ли вызывать процедуры CULA из ядер устройств?

Поэтому я пытаюсь понять, смогу ли я получить какое-то существенное ускорение от использования графического процессора для решения небольшой переопределенной системы уравнений, решая кучу одновременно. Мой текущий алгоритм ...

1 ответ

Реализация хеш-таблицы для GPU [закрыто]

Я ищу реализацию хеш-таблицы, которую я могу использовать для кодирования CUDA. Есть ли там кто-нибудь хороший? Что-то вроде словаря Python. Я буду использовать строки в качестве моих ключей

5 ответов

Как позволить cmake найти CUDA

Я пытаюсь построитьэтот проект [http://www.staff.science.uu.nl/~faggi101/gpucluster.tar.gz], который имеет CUDA в качестве зависимости. Но скрипт cmake не может найти установку CUDA в системе: cls ~/workspace/gpucluster/cluster/build $ cmake .. ...

1 ответ

Эффективность функции Маллока в CUDA

Я пытаюсь перенести некоторые коды процессора в CUDA. Моя карта CUDA основана на архитектуре Fermi, и поэтому я могу использовать функцию malloc () в устройстве для динамического распределения памяти и не нужно много менять исходные ...

1 ответ

Подсчет вхождений чисел в массиве CUDA

У меня есть массив целых чисел без знака, хранящихся на графическом процессоре с CUDA (обычно1000000 элементы). Я хотел бы посчитать вхождение каждого числа в массиве. Есть только несколько отдельных чисел (о10), но эти цифры могут варьироваться ...

4 ответа

Простейший возможный пример, показывающий, как GPU превосходит CPU с помощью CUDA

Я ищу максимально сжатый объем кода, который можно кодировать как для процессора (используя g ++), так и для графического процессора (используя nvcc), для которого графический процессор последовательно превосходит центральный процессор. Любой тип ...