Результаты поиска по запросу "cuda"

1 ответ

Так что это была ошибка Intellisense. Если бы у вас был установлен уровень детализации, вы бы увидели фактическую ошибку от nvcc

ько начал изучать немного CUDA, и я столкнулся с этой ошибкой в ​​следующей строке, в выражении <<< >>> #include "kernels.h" #include "helpers.h" #include <iostream> #include <cmath> #include <cuda_runtime.h> #include ...

3 ответа

Ошибка компоновки nvcc.exe Файл конфигурации Microsoft Visual Studio 'vcvars64.bat' не найден

Я хочу использоватьnvcc -ptx из командной строки Windows, но я всегда получаю это сообщение об ошибке: nvcc: фатальная ошибка: файл конфигурации Microsoft Visual Studio 'vcvars64.bat' не найден для установки в C: \ Program Files (x86) \ Microsoft ...

1 ответ

Точечное произведение двух векторов с плавающей запятой одинарной точности дает в ядре CUDA разные результаты, чем на хосте

При отладке некоторого кода CUDA я сравнивал с эквивалентным кодом ЦП, используяprintf заявления, и заметил, что в некоторых случаях мои результаты отличались; они не обязательно были неправильными на обеих платформах, так как они были в пределах ...

ТОП публикаций

1 ответ

@JEM_Mosig FYI или любой другой, кто хочет получить к нему доступ из терминала, вы можете добавить эти строки в ваш файл ~ / .bashrc - это скрытый файл в вашем домашнем каталоге

аюсь запустить приведенный ниже код, но сообщается об ошибке: NvvmSupportError: libNVVM не может быть найден. Делатьconda install cudatoolkit: библиотека nvvm не найдена Моя среда разработки: Ubuntu 17.04, Spyder / Python3.5, и я установил ...

2 ответа

Вот

аюсь установить tenorflow, который поддерживает GPU. Я попробовал информацию в следующей ссылке https://www.tensorflow.org/install/install_windows [https://www.tensorflow.org/install/install_windows] CUDA® Toolkit 8.0cuDNN v6.0Графическая ...

1 ответ

Суммирование строк матрицы (хранящихся в мажорном порядке или в мажорном столбце) в CUDA

Я работаю над проблемой суммирования строк матрицы в CUDA. Я даю следующий пример. Предположим иметь следующее20 * 4 массив: 1 2 3 4 4 1 2 3 3 4 1 2 . 1 2 3 4 . . . . . . . . 2 1 3 4После сглаживания 2d-массива в 1d-массив (в порядке основной ...

5 ответов

Valgrind и CUDA: Есть ли реальные утечки?

У меня в приложении очень простой компонент CUDA. Valgrind сообщает о множестве утечек и недостижимых проблем, связанных с вызовами cudaMalloc. Эти утечки реальны? Я звонюcudaFree для каждогоcudaMalloc, Это неспособность Valgrind ...

1 ответ

Приведенный выше код должен работать, но в нем так много неправильного, что я бы не советовал использовать его для чего-либо. Вы были предупреждены.

ь у меня есть thrust::device_vector<int> A[N];и моя функция ядра __global__ void kernel(...) { auto a = A[threadIdx.x]; }Я знаю, что через thrust :: raw_pointer_cast я могу передать device_vector ядру. Но как я могу передать массив векторов к нему?

1 ответ

, а затем попробуйте увеличить задержку.

с: Поскольку я увеличиваю количество данных, которые обрабатываются внутри цикла, который находится внутриCUDA kernel - это вызывает приложение, чтобы прервать! исключение: ManagedCuda.CudaException: 'ErrorLaunchFailed: на устройстве ...

8 ответов

Для описания параметра.

етил, что приложения CUDA обычно имеют приблизительное максимальное время выполнения 5-15 секунд, прежде чем они выйдут из строя и выйдут. Я понимаю, что идеально, чтобы приложение CUDA не выполнялось так долго, но при условии, что это правильный ...