Результаты поиска по запросу "gpgpu"

2 ответа

Вычисления общего назначения с шейдерами Vertex / Pixel (Open GL / DirectX)

У меня есть вопрос по поводу вычислительных шейдеров. компьютерные шейдеры доступны в DX 9? Можно ли по-прежнему использовать вычислительный шейдер с драйвером DX9, если на графическом процессоре нет фрагмента вычислительного шейдера? (У SGX 545 ...

6 ответов

@einpoklum Я добавил сгенерированный код PTX, согласно вашему предложению.

сто читал:Эффективное деление значения без знака на степень два, округлениеи мне было интересно, какой самый быстрый способ сделать это в CUDA. Конечно, под ...

1 ответ

CUDA Снижение тяги с двумя массивами

У меня есть следующий (компилируемый и исполняемый) код с использованием CUDA Thrust для выполнения сокращенияfloat2 массивы. Работает правильно using namespace std; // includes, system #include <stdlib.h> #include <stdio.h> #include <string.h> ...

ТОП публикаций

2 ответа

Обсудив это с кем-то еще, мы пришли к выводу, что, хотя у графических процессоров есть MMU (для обеспечения виртуальной адресации), он не обеспечивает защиту памяти. MMU не обязательно имеют эту функциональность.

много подходов, когда речь идет о запуске ненадежного кода на типичном процессоре: песочницы, поддельные корни, виртуализация ... Как насчет ненадежного кода для GPGPU (OpenCL, cuda или уже скомпилированный)? Предполагая, что память на ...

2 ответа

Спасибо за помощь. Нашел 1-ую ссылку в гугле, но не совсем пригодился. Второй очень интересный. они говорят о «предстоящей книге». это был 2009 год, он вышел в итоге? Не могу найти это.

го предыстории: Я начинаю с GPGPU (OpenCL), я использую Java-упаковщик (jogamp.jocl [http://jogamp.org/jocl/www/]в надежде, что это даст мне возможность абстрагироваться от мелкого песка и использовать стандартную ООП на более высоких уровнях. ...

8 ответов

Для описания параметра.

етил, что приложения CUDA обычно имеют приблизительное максимальное время выполнения 5-15 секунд, прежде чем они выйдут из строя и выйдут. Я понимаю, что идеально, чтобы приложение CUDA не выполнялось так долго, но при условии, что это правильный ...

3 ответа

Я получил дополнительную информацию от

ю, что устройства до архитектуры Fermi имели 8 SP в одном мультипроцессоре. То же самое в архитектуре Ферми?

3 ответа

Странное поведение с использованием локальной памяти в OpenCL

ня я добавил еще четыре__local переменные в мое ядро, чтобы вывести промежуточные результаты. Но просто добавив еще четыре переменные к сигнатуре ядра и добавив соответствующие аргументы ядра, преобразую весь вывод ядра в «0». Ни одна из функций ...

2 ответа

Выполнение атомарных операций на разделяемой памяти

Как выполняются атомарные операции, когда адрес, который им предоставляется, находится в блочной общей памяти? Во время атомарной операции он приостанавливает доступ к одному и тому же банку совместно используемой памяти другими потоками внутри ...

0 ответов

 выполнить параллельно.

мация - 32 потока. 32 потока выполняются параллельно в многопроцессорном режиме? Если 32 потока не выполняются параллельно, тогда в варпе нет условия гонки. Я получил это сомнение после просмотра некоторых примеров.