Результаты поиска по запросу "cuda"

1 ответ

Функция Pow CUDA с целочисленными аргументами

Я новичок в CUDA и не могу понять, что я делаю неправильно. Я пытаюсь вычислить расстояние объекта, у которого есть идентификатор в массиве, ось x в массиве и ось y в массиве, чтобы найти соседей для каждого объекта __global__ void dist(int ...

1 ответ

CUDA - насколько медленнее идет передача по PCI-E?

Если я перенесу один байт из ядра CUDA в PCI-E на хост (память без копирования), насколько это медленно по сравнению с передачей чего-то вроде 200 мегабайт? Что я хотел бы знать, так как я знаю, что передача по PCI-E медленна для ядра CUDA, это: ...

1 ответ

Почему изменение размеров блока и сетки так сильно влияет на время выполнения?

Я работаю над кударуководство [https://www.udacity.com]преобразование изображения RGBA в оттенки серого. Но я не мог понять, почему изменениеblockSize а такжеgridSize делает улучшение времени X33. __global__ void rgba_to_greyscale(const uchar4* ...

ТОП публикаций

1 ответ

CUDA-GDB сбой с толчком (CUDA выпуск 5.5)

У меня есть следующая тривиальная программа "тяга :: сбор" (взятая непосредственно из документации "тяга :: сбор") #include <thrust/gather.h> #include <thrust/device_vector.h> int main(void) { // mark even indices with a 1; odd indices with a 0 ...

1 ответ

Функция-член объекта C ++ как функция CUDA __global__

У меня есть базовый класс: template <class T> class A{ public: // some data T data; //some functions like constructs etc. ... // one virtual function virtual void evaluate() = 0; }и производный класс: template <class T> class B:public A<T>{ ...

1 ответ

CUDA Array Сокращение

Я знаю, что есть несколько вопросов, похожих на этот, на который уже дан ответ, но я не смог собрать что-то очень полезное из них, кроме того, что я, вероятно, неправильно что-то проиндексировал. Я пытаюсь преобразовать последовательное ...

1 ответ

Глобальный массив cudaMalloc вызывает ошибку сегмента

Я обнаружил некоторые трудности при попытке получить доступ к глобальному массиву из функции, которая выполняется с устройства: float globTemp[3][3] = "some value in here"; __device__ float* globTemp_d; __global__ void compute(int *a, int w) { ...

3 ответа

Как запустить CUDA без графического процессора, используя программную реализацию?

В моем ноутбуке нет видеокарт nVidia, и я хочу работать на CUDA. На веб-сайте говорится, что CUDA можно использовать в режиме эмуляции и на оборудовании, отличном от CUDA. Но когда я попытался установить драйверы CUDA, загруженные с их веб-сайта, ...

1 ответ

удаление элементов из device_vector

значения thrust :: device_vector ключи thrust :: device_vector; После инициализации ключи содержат несколько элементов, равных -1. Я хотел удалить элементы в ключах и в той же позиции значений. Но я не знаю, как с этим бороться параллельно?

3 ответа

Параллельная реализация для нескольких SVD с использованием CUDA

Я новичок в параллельном программировании с использованием графического процессора, поэтому я прошу прощения, если вопрос широкий или расплывчатый. Я знаю, что в библиотеке CULA есть некоторая параллельная функция SVD, но какой должна быть ...