Результаты поиска по запросу "cuda"
Я думаю, что в большинстве случаев конфликты совместно используемых банков играют основную часть повторов, затем глобальные повторы памяти, затем другие конфликты, такие как постоянные конфликты памяти, пропуски кэша команд и т. Д. К сожалению, официальной информации об этом нет.
учил информацию от CUDA Profiler. Я так растерялся, почему Replays Instruction! = Воспроизведение памяти Grobal + воспроизведение локальной памяти + воспроизведение конфликта общего банка? Смотрите следующую информацию, которую я получил от ...
Для каких размеров обычная загрузка и сохранение в глобальной памяти в CUDA atomic?
Являются ли общие операции чтения и записи в глобальной памяти атомарными в CUDA, если: Это 4-х байтовая инструкция? (Я предполагаю, что да)Это 8-байтовая или 16-байтовая инструкция? (Я предполагаю, что да)По крайней мере, на Кеплере и Ферми ...
Генерация перестановок с помощью CUDA
Я читал о CUDA и пытался реализовать простой код, чтобы создать все возможные перестановкиarray {a,b,c,d}, но я не знаю, как реализовать способ CUDA (так как все примеры, которые я прочитал, имели видa[blockIdx.x] = b[blockIdx.x] + c[blockIdx.x] ...
не были скомпилированы для архитектуры CUDA. Я не видел никаких стандартных библиотек C для CUDA.
ю, что есть ограничение, чтобы звонить только__device__ функции в ядре. Это мешает мне вызывать стандартные функции, такие какstrcmp() и так далее в ядре. На данный момент я не могу понять / найти причины для этого. Не мог ли компилятор просто ...
Можно ли вызывать процедуры CULA из ядер устройств?
Поэтому я пытаюсь понять, смогу ли я получить какое-то существенное ускорение от использования графического процессора для решения небольшой переопределенной системы уравнений, решая кучу одновременно. Мой текущий алгоритм ...
Реализация хеш-таблицы для GPU [закрыто]
Я ищу реализацию хеш-таблицы, которую я могу использовать для кодирования CUDA. Есть ли там кто-нибудь хороший? Что-то вроде словаря Python. Я буду использовать строки в качестве моих ключей
Как позволить cmake найти CUDA
Я пытаюсь построитьэтот проект [http://www.staff.science.uu.nl/~faggi101/gpucluster.tar.gz], который имеет CUDA в качестве зависимости. Но скрипт cmake не может найти установку CUDA в системе: cls ~/workspace/gpucluster/cluster/build $ cmake .. ...
Эффективность функции Маллока в CUDA
Я пытаюсь перенести некоторые коды процессора в CUDA. Моя карта CUDA основана на архитектуре Fermi, и поэтому я могу использовать функцию malloc () в устройстве для динамического распределения памяти и не нужно много менять исходные ...
Подсчет вхождений чисел в массиве CUDA
У меня есть массив целых чисел без знака, хранящихся на графическом процессоре с CUDA (обычно1000000 элементы). Я хотел бы посчитать вхождение каждого числа в массиве. Есть только несколько отдельных чисел (о10), но эти цифры могут варьироваться ...
Простейший возможный пример, показывающий, как GPU превосходит CPU с помощью CUDA
Я ищу максимально сжатый объем кода, который можно кодировать как для процессора (используя g ++), так и для графического процессора (используя nvcc), для которого графический процессор последовательно превосходит центральный процессор. Любой тип ...