Результаты поиска по запросу "cuda"

1 ответ

Одновременное выполнение ядра CUDA с несколькими ядрами на поток

Использование разных потоков для ядер CUDA делает возможным параллельное выполнение ядра. Следовательноn ядра наn потоки теоретически могут работать одновременно, если они вписываются в аппаратное обеспечение, верно? Теперь я сталкиваюсь со ...

1 ответ

Транспонировать умножение матриц в cuBLAS howto

1 ответ

Перенаправление printf CUDA в поток C ++

Постановка задачиЯ работаю над большим проектом, который использует журнал для отладки. Поскольку мне нравится следить за тем, что происходит в некоторых ядрах CUDA, я попытался найти способ ...

ТОП публикаций

2 ответа

Генерация случайных чисел: CPU против GPU, который сейчас выигрывает?

2 ответа

Неявный конструктор в вызове ядра CUDA

Я пытаюсь передать POD ядру, которое имеет в качестве параметров не POD и имеет неявные конструкторы. Идея заключается в том, чтобы: выделить некоторую памят...

1 ответ

Недопустимый символ устройства при копировании в постоянную память CUDA

У меня есть несколько файлов для приложения в обработке изображений. Поскольку число строк и столбцов для изображения не изменяется при выполнении какого-либо алгоритма обработки изображений, я пытался поместить эти значения в постоянную память. ...

1 ответ

Как я могу переопределить ограничение времени выполнения ядра CUDA в Windows со вторичными графическими процессорами?

Из Нвидиис веб-сайта, это объясняет проблему тайм-аута:Q: Каково максимальное время выполнения ядра? В Windows максимальное время запуска отдельных программ ...

1 ответ

Тип возвращаемого значения тяги :: remove_if

1 ответ

cudaMemcpyToSymbol против cudaMemcpy почему это все еще существует (cudaMemcpyToSymbol)

Как указано в других вопросах и по ссылке, вы больше не можете использовать имя символа для этой функции. Теперь, когда эта функция исчезла, когда-нибудь захочетсяcudaMemCpy? Когда бы вы хотели использовать его вообще? Каков компромисс или ...

2 ответа

Параллельное тензорное произведение Кронекера на графических процессорах с использованием CUDA

Я параллельно работаю [этот файл] [1] на графическом процессоре, используя [PTX-файл с matlab parallel.gpu.CUDAkernel] [2]. Моя проблема с [тензорным произведением крон] [3] заключается в следующем. Мой код должен умножить два вектораkron(a,b) ...