Результаты поиска по запросу "gpu"

3 ответа

Деление чисел с плавающей запятой на GPU отличается от деления на CPU

Когда я делю два числа с плавающей запятой на GPU, результат0.196405, Когда я делю их на процессор, результат0.196404, Фактическое значение с помощью калькулятора0.196404675, Как сделать деление на GPU и CPU одинаковыми?

1 ответ

Функциональный объект не работает должным образом

Я определил следующий объект функции: struct Predicate1 { __device__ bool operator () (const DereferencedIteratorTuple& lhs, const DereferencedIteratorTuple& rhs) { using thrust::get; //if you do <=, returns last occurence of largest element. ...

1 ответ

Ускорение поиска в массиве после обхода?

У меня большой 123МБintмассив, и он в основном используется так: private static int[] data = new int[32487834]; static int eval(int[] c) { int p = data[c[0]]; p = data[p + c[1]]; p = data[p + c[2]]; p = data[p + c[3]]; p = data[p + c[4]]; p = ...

ТОП публикаций

1 ответ

Большое матричное умножение на GPU

Мне нужно реализовать умножение матриц на GPU с CUDA для больших матриц. Размер каждой матрицы в отдельности больше, чем память GPU. Поэтому я думаю, что мне нужен алгоритм, чтобы сделать это эффективно. Я ходил по Интернету, но не мог найти. ...

1 ответ

Версии GPU алгоритмов OpenCV медленнее, чем версии CPU на моем компьютере?

Пытаясь ускорить простой алгоритм с использованием графического процессора с OpenCV, я заметил, что на моей машине (Ubuntu 12.10, NVidia 9800GT, Cuda 4.2.9, g ++ 4.7.2) версия графического процессора на самом деле медленнее, чем ...

2 ответа

Сколько потоков на ядро предполагается при расчете GFLOPS для видеокарт Nvidia?

Я заинтересован в получении количества наносекунд, которое потребуется для выполнения 1 FLOP двойной точности на GeForce GTX 550 Ti. Чтобы сделать это, я придерживаюсь этого подхода: я обнаружил, что максимальная производительность карты с ...

12 ответов

цветное изображение в черно-белое изображение с использованием параллельной обработки CUDA

Я пытаюсь решить проблему, в которой я должен изменить цветное изображение на изображение в оттенках серого. Для этой цели я использую параллельный подход CUDA. Код Kerne, который я вызываю на GPU, выглядит следующим образом. __global__ void ...

2 ответа

Постоянные потоки в OpenCL и CUDA

Я читал некоторые статьи, в которых говорилось о «постоянных потоках» для GPGPU, но я не совсем понимаю. Кто-нибудь может дать мне пример или показать мне использование этого способа программирования? Что я запомнил после прочтения и поиска в ...

2 ответа

Несколько процессов, запускающих ядра CUDA параллельно

Я знаю, что NVIDIA GPU с вычислительной способностью 2.x или выше может выполнять до 16 ядер одновременно. Однако мое приложение порождает 7 «процессов», и каждый из этих 7 процессов запускает ядра CUDA. Мой первый вопрос: каково будет ожидаемое ...

1 ответ

добавление шага вектора медленнее на CUDA

Я пытаюсь запустить функцию добавления векторного шага в коде CUDA C ++, но для больших массивов с плавающей запятой размером 5 000 000 он работает медленнее, чем моя версия процессора. Ниже приведен соответствующий код CUDA и процессора, о ...