Результаты поиска по запросу "cuda"

1 ответ

Передача объекта класса в ядро

Можем ли мы передать объект в функцию ядра? Считай, у меня есть класс class MyClass { public: int value; float rate; MyClass() { value = 0; rate = 0; } MyClass(int v,float r) { value = v; rate = r; } };и мое ядро принимает массив объектов ...

1 ответ

ядра CUDA не выполняются одновременно

Я пытаюсь исследовать свойство одновременного выполнения ядра моего Nvidia Quadro 4000, который имеет возможность 2.0. Я использую 2 разных потока, которые работают так же, как показано ниже: Скопируйте H2D два разных куска закрепленной ...

1 ответ

Библиотека JPEG в CUDA

Я пытаюсь сжать и распаковать изображения в CUDA. Пока я нашел эту библиотеку: http://sourceforge.net/projects/cuj2k/?source=navbar [http://sourceforge.net/projects/cuj2k/?source=navbar] Но не так много документации доступно. Кто-нибудь знает о ...

ТОП публикаций

3 ответа

Как нормализовать матричные столбцы в CUDA с максимальной производительностью?

Как эффективно нормализовать матричные столбцы в CUDA? Моя матрица хранится в столбце-мажоре, и типичный размер - 2000x200. Операция может быть представлена в следующем коде Matlab. A = rand(2000,200); A = exp(A); A = A./repmat(sum(A,1), ...

1 ответ

Как быстро сжать разреженный массив с помощью CUDA C?

Резюмемассив[A - B - - - C] в памяти устройства, но хочу[A B C] - Какой самый быстрый способ с CUDA C? контекстУ меня есть массивA целых чисел в памяти устройства (GPU). На каждой итерации я случайным образом выбираю несколько элементов размером ...

1 ответ

Cuda программирование на Mac с Intel HD 4000 [закрыто]

Что мне нужно сделать, чтобы иметь возможность программировать на Cuda на Macbook Air с графикой Intel HD 4000? Настроить виртуальную машину? Купить внешнюю карту Nvidia? Это вообще возможно?

1 ответ

Большое матричное умножение на GPU

Мне нужно реализовать умножение матриц на GPU с CUDA для больших матриц. Размер каждой матрицы в отдельности больше, чем память GPU. Поэтому я думаю, что мне нужен алгоритм, чтобы сделать это эффективно. Я ходил по Интернету, но не мог найти. ...

1 ответ

Версии GPU алгоритмов OpenCV медленнее, чем версии CPU на моем компьютере?

Пытаясь ускорить простой алгоритм с использованием графического процессора с OpenCV, я заметил, что на моей машине (Ubuntu 12.10, NVidia 9800GT, Cuda 4.2.9, g ++ 4.7.2) версия графического процессора на самом деле медленнее, чем ...

1 ответ

Транспонировать умножение матриц в cuBLAS howto

Проблема проста: у меня есть две матрицы, A и B, которые являются M на N, где M >> N. Я хочу сначала взять транспонирование A, а затем умножить это на B (A ^ T * B), чтобы положить это в C, который является N на N. У меня все настроено для A и B, ...

2 ответа

Сколько потоков на ядро предполагается при расчете GFLOPS для видеокарт Nvidia?

Я заинтересован в получении количества наносекунд, которое потребуется для выполнения 1 FLOP двойной точности на GeForce GTX 550 Ti. Чтобы сделать это, я придерживаюсь этого подхода: я обнаружил, что максимальная производительность карты с ...