Результаты поиска по запросу "gpgpu"
Вычисления общего назначения с шейдерами Vertex / Pixel (Open GL / DirectX)
У меня есть вопрос по поводу вычислительных шейдеров. компьютерные шейдеры доступны в DX 9? Можно ли по-прежнему использовать вычислительный шейдер с драйвером DX9, если на графическом процессоре нет фрагмента вычислительного шейдера? (У SGX 545 ...
@einpoklum Я добавил сгенерированный код PTX, согласно вашему предложению.
сто читал:Эффективное деление значения без знака на степень два, округлениеи мне было интересно, какой самый быстрый способ сделать это в CUDA. Конечно, под ...
CUDA Снижение тяги с двумя массивами
У меня есть следующий (компилируемый и исполняемый) код с использованием CUDA Thrust для выполнения сокращенияfloat2 массивы. Работает правильно using namespace std; // includes, system #include <stdlib.h> #include <stdio.h> #include <string.h> ...
Обсудив это с кем-то еще, мы пришли к выводу, что, хотя у графических процессоров есть MMU (для обеспечения виртуальной адресации), он не обеспечивает защиту памяти. MMU не обязательно имеют эту функциональность.
много подходов, когда речь идет о запуске ненадежного кода на типичном процессоре: песочницы, поддельные корни, виртуализация ... Как насчет ненадежного кода для GPGPU (OpenCL, cuda или уже скомпилированный)? Предполагая, что память на ...
Спасибо за помощь. Нашел 1-ую ссылку в гугле, но не совсем пригодился. Второй очень интересный. они говорят о «предстоящей книге». это был 2009 год, он вышел в итоге? Не могу найти это.
го предыстории: Я начинаю с GPGPU (OpenCL), я использую Java-упаковщик (jogamp.jocl [http://jogamp.org/jocl/www/]в надежде, что это даст мне возможность абстрагироваться от мелкого песка и использовать стандартную ООП на более высоких уровнях. ...
Для описания параметра.
етил, что приложения CUDA обычно имеют приблизительное максимальное время выполнения 5-15 секунд, прежде чем они выйдут из строя и выйдут. Я понимаю, что идеально, чтобы приложение CUDA не выполнялось так долго, но при условии, что это правильный ...
Я получил дополнительную информацию от
ю, что устройства до архитектуры Fermi имели 8 SP в одном мультипроцессоре. То же самое в архитектуре Ферми?
Странное поведение с использованием локальной памяти в OpenCL
ня я добавил еще четыре__local переменные в мое ядро, чтобы вывести промежуточные результаты. Но просто добавив еще четыре переменные к сигнатуре ядра и добавив соответствующие аргументы ядра, преобразую весь вывод ядра в «0». Ни одна из функций ...
Выполнение атомарных операций на разделяемой памяти
Как выполняются атомарные операции, когда адрес, который им предоставляется, находится в блочной общей памяти? Во время атомарной операции он приостанавливает доступ к одному и тому же банку совместно используемой памяти другими потоками внутри ...
выполнить параллельно.
мация - 32 потока. 32 потока выполняются параллельно в многопроцессорном режиме? Если 32 потока не выполняются параллельно, тогда в варпе нет условия гонки. Я получил это сомнение после просмотра некоторых примеров.