Результаты поиска по запросу "cuda"

2 ответа

Как я могу реализовать пользовательскую элементарную функцию, включающую несколько переменных?

Я хотел бы реализовать эту атомарную функцию в CUDA: __device__ float lowest; // global var __device__ int lowIdx; // global var float realNum; // thread reg var int index; // thread reg var if(realNum < lowest) { lowest= realNum; // the new ...

1 ответ

Оценка выражений, состоящих из поэлементных матричных операций в Thrust

Я хотел бы использовать Thrust для оценки выражений, состоящих из поэлементных матричных операций. Чтобы было понятно, рассмотрим выражение вроде: D=A*B+3*sin(C) гдеA, B, C а такжеD Матрицы, конечно же, одного размера. Краткое руководство по ...

2 ответа

Какова цель использования нескольких «арочных» флагов в компиляторе Nvidia NVCC?

Недавно я понял, как NVCC компилирует код устройства CUDA для различных вычислительных архитектур. Насколько я понимаю, при использовании опции NVgen -gencode «arch» - это минимальная вычислительная архитектура, требуемая приложением ...

ТОП публикаций

3 ответа

Преобразование октавы для использования CuBLAS

Я хотел бы преобразовать Octave, чтобы использовать CuBLAS для умножения матриц. Это видео, кажется, показывает, что это так же просто, как набрать 28 символов: Использование библиотеки CUDA для ускорения ...

1 ответ

настройка текстуры CUDA 2D «unsigned char» для линейной интерполяции

У меня есть линейный массив без знака символов, представляющих 2D-массив. Я хотел бы поместить его в 2D-текстуру CUDA и выполнить линейную интерполяцию (с плавающей запятой), то есть сделать так, чтобы вызов текстуры извлекал 4 ближайших соседа ...

1 ответ

Связывание Cuda в выпуске C ++

Я искал существующие вопросы, но я не могу решить это. У меня есть файл blur_mask.cc с: #include <iostream> #include <ctime> #include <opencv2/highgui/highgui.hpp> #include <opencv2/gpu/gpu.hpp> #include <vector_types.h> #include ...

1 ответ

Уничтожение потоков CUDA и CudaDeviceReset

Я реализовал следующий класс с использованием потоков CUDA class CudaStreams { private: int nStreams_; cudaStream_t* streams_; cudaStream_t active_stream_; public: // default constructor CudaStreams() { } // streams initialization void ...

1 ответ

CUDA atomicAdd () дает неправильный результат

Я новичок в CUDA, играю с ядрами CUDA впервые. У меня есть следующее ядро, которое реализует конвульсию (очень наивно) с фиктивным циклом, который выполняет вычисление одного и того же элемента 1000 раз в глобальной памяти (см. Ниже). Проблема в ...

3 ответа

cuFFT и потоки

Я пытаюсь запустить несколько ядер CUDA FFT асинхронно с использованием потоков. Для этого я создаю свои потоки, прямые и обратные планы cuFFT следующим образом: streams = (cudaStream_t*) malloc(sizeof(cudaStream_t)*streamNum); plansF ...

3 ответа

Поиск упорядоченного массива в ядре CUDA

Я пишу ядро ​​CUDA, и каждый поток должен выполнить следующую задачу: предположим, у меня есть упорядоченный массив