Результаты поиска по запросу "cuda"
Как я могу реализовать пользовательскую элементарную функцию, включающую несколько переменных?
Я хотел бы реализовать эту атомарную функцию в CUDA: __device__ float lowest; // global var __device__ int lowIdx; // global var float realNum; // thread reg var int index; // thread reg var if(realNum < lowest) { lowest= realNum; // the new ...
Оценка выражений, состоящих из поэлементных матричных операций в Thrust
Я хотел бы использовать Thrust для оценки выражений, состоящих из поэлементных матричных операций. Чтобы было понятно, рассмотрим выражение вроде: D=A*B+3*sin(C) гдеA, B, C а такжеD Матрицы, конечно же, одного размера. Краткое руководство по ...
Какова цель использования нескольких «арочных» флагов в компиляторе Nvidia NVCC?
Недавно я понял, как NVCC компилирует код устройства CUDA для различных вычислительных архитектур. Насколько я понимаю, при использовании опции NVgen -gencode «arch» - это минимальная вычислительная архитектура, требуемая приложением ...
Преобразование октавы для использования CuBLAS
Я хотел бы преобразовать Octave, чтобы использовать CuBLAS для умножения матриц. Это видео, кажется, показывает, что это так же просто, как набрать 28 символов: Использование библиотеки CUDA для ускорения ...
настройка текстуры CUDA 2D «unsigned char» для линейной интерполяции
У меня есть линейный массив без знака символов, представляющих 2D-массив. Я хотел бы поместить его в 2D-текстуру CUDA и выполнить линейную интерполяцию (с плавающей запятой), то есть сделать так, чтобы вызов текстуры извлекал 4 ближайших соседа ...
Связывание Cuda в выпуске C ++
Я искал существующие вопросы, но я не могу решить это. У меня есть файл blur_mask.cc с: #include <iostream> #include <ctime> #include <opencv2/highgui/highgui.hpp> #include <opencv2/gpu/gpu.hpp> #include <vector_types.h> #include ...
Уничтожение потоков CUDA и CudaDeviceReset
Я реализовал следующий класс с использованием потоков CUDA class CudaStreams { private: int nStreams_; cudaStream_t* streams_; cudaStream_t active_stream_; public: // default constructor CudaStreams() { } // streams initialization void ...
CUDA atomicAdd () дает неправильный результат
Я новичок в CUDA, играю с ядрами CUDA впервые. У меня есть следующее ядро, которое реализует конвульсию (очень наивно) с фиктивным циклом, который выполняет вычисление одного и того же элемента 1000 раз в глобальной памяти (см. Ниже). Проблема в ...
cuFFT и потоки
Я пытаюсь запустить несколько ядер CUDA FFT асинхронно с использованием потоков. Для этого я создаю свои потоки, прямые и обратные планы cuFFT следующим образом: streams = (cudaStream_t*) malloc(sizeof(cudaStream_t)*streamNum); plansF ...
Поиск упорядоченного массива в ядре CUDA
Я пишу ядро CUDA, и каждый поток должен выполнить следующую задачу: предположим, у меня есть упорядоченный массив