Результаты поиска по запросу "cuda"
как связать библиотеку (например, CUBLAS, CUSPARSE) для CUDA в Windows
Я пытаюсь скомпилировать программу cuda, которая использует библиотеку cusparse. Я получаю ссылку на ошибку: kernel.cu.obj : error LNK2019: unresolved external symbol _cusparseSetMatIndexBase@8 referenced in function _mainИ много ошибок такого ...
Возможна ли своевременная (jit) компиляция ядра CUDA?
Поддерживает ли CUDA JIT-компиляцию ядра CUDA? Я знаю, что OpenCL предлагает эту функцию. У меня есть некоторые переменные, которые не изменяются во время выполнения (то есть зависят только от входного файла), поэтому я хотел бы определить ...
Как мы используем cuPrintf ()?
Что мы должны сделать, чтобы использовать cuPrintf ()? (возможность вычисления устройства 1.2, Ubuntu 12) Я не смог найти "cuPrintf.cu" и "cudaPrintf.cuh", поэтому я скачал их код и включил их: #include "cuPrintf.cuh" #include ...
Как запустить отладочную версию проекта в nsight с помощью команды optirun?
Я писал простую программу cuda (я студент, поэтому мне нужно потренироваться), и дело в том, что я могу скомпилировать ее с терминала с помощью nvcc (используя Kubuntu 12.04LTS), а затем выполнить ее с помощью optirun ./a.out (Hardver GeForce GT ...
Cuda версия не работает во время серийной работы
мой следующий минималистский код Cuda возвращает неверный результат (все полигоны имеют 0 вершин в конце), в то время как один и тот же код, работающий последовательно в C ++, работает хорошо. Проблема смущающе параллельна: нет связи, нет ...
Стратегии выбора времени для ядер CUDA: плюсы и минусы?
При синхронизации ядер CUDA следующее не работает, потому что ядро не блокирует выполнение программы CPU во время выполнения: start timer kernel<<<g,b>>>(); end timerЯ видел три основных способа (успешно) синхронизировать ядра CUDA: (1) Две ...
CUDA Parallel NSight Отладка хоста и устройства одновременно
Кто-нибудь знает, возможно ли отладить CUDA с помощью параллельного NSight на удаленной машине? Я могу войти в код CUDA, но не в код своего хоста. В нем говорится, что CUDA имеет возможность генерировать отладочную информацию хоста, поэтому ...
cuBLAS argmin - segfault, если вывод в память устройства?
В cuBLAS,cublasIsamin() дает argmin для массива с одинарной точностью. Вот полное объявление функции:cublasStatus_t cublasIsamin(cublasHandle_t handle, int n, const float *x, int incx, int *result) Руководство программиста cuBLAS предоставляет ...
Ядро CUDA как функция-член класса
Я использую CUDA 5.0 и карту Compute Capability 2.1. Вопрос довольно прост: может ли ядро быть частью класса? Например: class Foo { private: //... public: __global__ void kernel(); }; __global__ void Foo::kernel() { //implementation here }Если ...
Каковы некоторые возможные причины ошибки сегментации при использовании компилятора nvcc CUDA?
У меня есть класс CUDA, давайте назовем этоA, определенный в заголовочном файле. Я написал тестовое ядро, которое создает экземпляр классаA, который хорошо компилируется и дает ожидаемый результат. Кроме того, у меня есть основное ядро CUDA, ...