Результаты поиска по запросу "gpgpu"
Стратегии выбора времени для ядер CUDA: плюсы и минусы?
При синхронизации ядер CUDA следующее не работает, потому что ядро не блокирует выполнение программы CPU во время выполнения: start timer kernel<<<g,b>>>(); end timerЯ видел три основных способа (успешно) синхронизировать ядра CUDA: (1) Две ...
cuBLAS argmin - segfault, если вывод в память устройства?
В cuBLAS,cublasIsamin() дает argmin для массива с одинарной точностью. Вот полное объявление функции:cublasStatus_t cublasIsamin(cublasHandle_t handle, int n, const float *x, int incx, int *result) Руководство программиста cuBLAS предоставляет ...
Запуск OpenCL на оборудовании от разных производителей
Я играл с реализацией ATI OpenCL в их бета-версии Stream 2.0. OpenCL в текущей бета-версии пока использует только процессор, а следующая версия должна поддерживать ядра GPU. Я скачал Stream, потому что на моей машине установлен графический ...
Функциональный объект не работает должным образом
Я определил следующий объект функции: struct Predicate1 { __device__ bool operator () (const DereferencedIteratorTuple& lhs, const DereferencedIteratorTuple& rhs) { using thrust::get; //if you do <=, returns last occurence of largest element. ...
Как быстро сжать разреженный массив с помощью CUDA C?
Резюмемассив[A - B - - - C] в памяти устройства, но хочу[A B C] - Какой самый быстрый способ с CUDA C? контекстУ меня есть массивA целых чисел в памяти устройства (GPU). На каждой итерации я случайным образом выбираю несколько элементов размером ...
Большое матричное умножение на GPU
Мне нужно реализовать умножение матриц на GPU с CUDA для больших матриц. Размер каждой матрицы в отдельности больше, чем память GPU. Поэтому я думаю, что мне нужен алгоритм, чтобы сделать это эффективно. Я ходил по Интернету, но не мог найти. ...
Постоянные потоки в OpenCL и CUDA
Я читал некоторые статьи, в которых говорилось о «постоянных потоках» для GPGPU, но я не совсем понимаю. Кто-нибудь может дать мне пример или показать мне использование этого способа программирования? Что я запомнил после прочтения и поиска в ...
как найти активные СМ?
Есть ли способ узнать количество свободных / активных SM? Или хотя бы прочитать значения напряжения / мощности или температуры каждого SM, по которым я могу знать, работает ли он или нет? (в режиме реального времени, пока на устройстве gpu ...
Как я могу переопределить ограничение времени выполнения ядра CUDA в Windows со вторичными графическими процессорами?
С сайта Nvidia это объясняет проблему тайм-аута: Q: Каково максимальное время выполнения ядра? В Windows максимальное время запуска отдельных программ на GPU составляет около 5 секунд. Превышение этого временного лимита обычно приводит к ошибке ...
Как я могу очистить память GPU с помощью CUDA (физический сброс недоступен)
Моя CUDA-программа потерпела крах во время выполнения, до того как память была очищена. В результате память устройства оставалась занятой. Я бегу на GTX 580, для чегоnvidia-smi --gpu-reset не поддерживается. размещениеcudaDeviceReset() в начале ...