Результаты поиска по запросу "cuda"

2 ответа

как связать библиотеку (например, CUBLAS, CUSPARSE) для CUDA в Windows

Я пытаюсь скомпилировать программу cuda, которая использует библиотеку cusparse. Я получаю ссылку на ошибку: kernel.cu.obj : error LNK2019: unresolved external symbol _cusparseSetMatIndexBase@8 referenced in function _mainИ много ошибок такого ...

2 ответа

Возможна ли своевременная (jit) компиляция ядра CUDA?

Поддерживает ли CUDA JIT-компиляцию ядра CUDA? Я знаю, что OpenCL предлагает эту функцию. У меня есть некоторые переменные, которые не изменяются во время выполнения (то есть зависят только от входного файла), поэтому я хотел бы определить ...

2 ответа

Как мы используем cuPrintf ()?

Что мы должны сделать, чтобы использовать cuPrintf ()? (возможность вычисления устройства 1.2, Ubuntu 12) Я не смог найти "cuPrintf.cu" и "cudaPrintf.cuh", поэтому я скачал их код и включил их: #include "cuPrintf.cuh" #include ...

ТОП публикаций

3 ответа

Как запустить отладочную версию проекта в nsight с помощью команды optirun?

Я писал простую программу cuda (я студент, поэтому мне нужно потренироваться), и дело в том, что я могу скомпилировать ее с терминала с помощью nvcc (используя Kubuntu 12.04LTS), а затем выполнить ее с помощью optirun ./a.out (Hardver GeForce GT ...

1 ответ

Cuda версия не работает во время серийной работы

мой следующий минималистский код Cuda возвращает неверный результат (все полигоны имеют 0 вершин в конце), в то время как один и тот же код, работающий последовательно в C ++, работает хорошо. Проблема смущающе параллельна: нет связи, нет ...

2 ответа

Стратегии выбора времени для ядер CUDA: плюсы и минусы?

При синхронизации ядер CUDA следующее не работает, потому что ядро не блокирует выполнение программы CPU во время выполнения: start timer kernel<<<g,b>>>(); end timerЯ видел три основных способа (успешно) синхронизировать ядра CUDA: (1) Две ...

2 ответа

CUDA Parallel NSight Отладка хоста и устройства одновременно

Кто-нибудь знает, возможно ли отладить CUDA с помощью параллельного NSight на удаленной машине? Я могу войти в код CUDA, но не в код своего хоста. В нем говорится, что CUDA имеет возможность генерировать отладочную информацию хоста, поэтому ...

1 ответ

cuBLAS argmin - segfault, если вывод в память устройства?

В cuBLAS,cublasIsamin() дает argmin для массива с одинарной точностью. Вот полное объявление функции:cublasStatus_t cublasIsamin(cublasHandle_t handle, int n, const float *x, int incx, int *result) Руководство программиста cuBLAS предоставляет ...

1 ответ

Ядро CUDA как функция-член класса

Я использую CUDA 5.0 и карту Compute Capability 2.1. Вопрос довольно прост: может ли ядро быть частью класса? Например: class Foo { private: //... public: __global__ void kernel(); }; __global__ void Foo::kernel() { //implementation here }Если ...

1 ответ

Каковы некоторые возможные причины ошибки сегментации при использовании компилятора nvcc CUDA?

У меня есть класс CUDA, давайте назовем этоA, определенный в заголовочном файле. Я написал тестовое ядро, которое создает экземпляр классаA, который хорошо компилируется и дает ожидаемый результат. Кроме того, у меня есть основное ядро CUDA, ...