Результаты поиска по запросу "cuda"
Передача объекта класса в ядро
Можем ли мы передать объект в функцию ядра? Считай, у меня есть класс class MyClass { public: int value; float rate; MyClass() { value = 0; rate = 0; } MyClass(int v,float r) { value = v; rate = r; } };и мое ядро принимает массив объектов ...
ядра CUDA не выполняются одновременно
Я пытаюсь исследовать свойство одновременного выполнения ядра моего Nvidia Quadro 4000, который имеет возможность 2.0. Я использую 2 разных потока, которые работают так же, как показано ниже: Скопируйте H2D два разных куска закрепленной ...
Библиотека JPEG в CUDA
Я пытаюсь сжать и распаковать изображения в CUDA. Пока я нашел эту библиотеку: http://sourceforge.net/projects/cuj2k/?source=navbar [http://sourceforge.net/projects/cuj2k/?source=navbar] Но не так много документации доступно. Кто-нибудь знает о ...
Как нормализовать матричные столбцы в CUDA с максимальной производительностью?
Как эффективно нормализовать матричные столбцы в CUDA? Моя матрица хранится в столбце-мажоре, и типичный размер - 2000x200. Операция может быть представлена в следующем коде Matlab. A = rand(2000,200); A = exp(A); A = A./repmat(sum(A,1), ...
Как быстро сжать разреженный массив с помощью CUDA C?
Резюмемассив[A - B - - - C] в памяти устройства, но хочу[A B C] - Какой самый быстрый способ с CUDA C? контекстУ меня есть массивA целых чисел в памяти устройства (GPU). На каждой итерации я случайным образом выбираю несколько элементов размером ...
Cuda программирование на Mac с Intel HD 4000 [закрыто]
Что мне нужно сделать, чтобы иметь возможность программировать на Cuda на Macbook Air с графикой Intel HD 4000? Настроить виртуальную машину? Купить внешнюю карту Nvidia? Это вообще возможно?
Большое матричное умножение на GPU
Мне нужно реализовать умножение матриц на GPU с CUDA для больших матриц. Размер каждой матрицы в отдельности больше, чем память GPU. Поэтому я думаю, что мне нужен алгоритм, чтобы сделать это эффективно. Я ходил по Интернету, но не мог найти. ...
Версии GPU алгоритмов OpenCV медленнее, чем версии CPU на моем компьютере?
Пытаясь ускорить простой алгоритм с использованием графического процессора с OpenCV, я заметил, что на моей машине (Ubuntu 12.10, NVidia 9800GT, Cuda 4.2.9, g ++ 4.7.2) версия графического процессора на самом деле медленнее, чем ...
Транспонировать умножение матриц в cuBLAS howto
Проблема проста: у меня есть две матрицы, A и B, которые являются M на N, где M >> N. Я хочу сначала взять транспонирование A, а затем умножить это на B (A ^ T * B), чтобы положить это в C, который является N на N. У меня все настроено для A и B, ...
Сколько потоков на ядро предполагается при расчете GFLOPS для видеокарт Nvidia?
Я заинтересован в получении количества наносекунд, которое потребуется для выполнения 1 FLOP двойной точности на GeForce GTX 550 Ti. Чтобы сделать это, я придерживаюсь этого подхода: я обнаружил, что максимальная производительность карты с ...