Результаты поиска по запросу "gpu-programming"

3 ответа

Как определить максимальный размер партии для обучающей модели RNN с тензорным потоком seq2seq

1 ответ

Что такое связная память на GPU?

1 ответ

nvidia-smi Объяснение использования летучих графических процессоров?

я знаю это

ТОП публикаций

1 ответ

Различия между VexCL, Thrust и Boost.Compute

При простом понимании этих библиотек они выглядят очень похожими. Я знаю, что VexCL и Boost.Compute используют OpenCl в качестве бэкэнда (хотя VexCL версии 1.0 также поддерживает CUDA в качестве бэкэнда), а Thrust использует CUDA. Помимо разных ...

8 ответов

Для описания параметра.

етил, что приложения CUDA обычно имеют приблизительное максимальное время выполнения 5-15 секунд, прежде чем они выйдут из строя и выйдут. Я понимаю, что идеально, чтобы приложение CUDA не выполнялось так долго, но при условии, что это правильный ...

1 ответ

 вызов.

я есть некоторые функции, которые загружают переменную в постоянную память устройства и запускают функцию ядра. Я заметил, что первый раз, когда одна функция загружает переменную в постоянную память, занимает 0,6 секунды, но следующие загрузки в ...

1 ответ

Потому что графические процессоры GeForce не поддерживают режим TCC. Это дизайн продукта. Вы ничего не можете с этим поделать.

PU - GeForce MX150, паскальская архитектура, CC. 6.1, CUDA 9.1, windows 10. Хотя мой графический процессор паскаль, но кооперативные группы не работают. Я хочу использовать его для межблочной синхронизации. Я обнаружил, что мой режим TCC не ...

1 ответ

Блестящий ответ, большое спасибо! :)

у вас есть рабочие элементы, выполняющиеся в волновом фронте, и есть условие, такое как: if(x){ ... } else{ .... }Что выполняют рабочие элементы? это тот случай, когда все рабочие элементы в волновом фронте будут выполнять первую ветвь (т.е.x ...

6 ответов

 из программного обеспечения CenterSpace (на которого я работаю), и вы можете запускать большие проблемы на своем NVIDIA GPU в считанные минуты из C #. NMath Premium - большая математическая библиотека C # / .NET, которая может выполнять большую часть LAPACK и FFT на графическом процессоре, но откатится к центральному процессору, если аппаратное обеспечение недоступно или размер проблемы не оправдывает обратное обращение к графическому процессору.

трю на использование графического процессора для обработки некоторых уравнений, но не могу понять, как я могу получить к нему доступ из C #. Я знаю, что платформы XNA и DirectX позволяют вам использовать шейдеры для доступа к графическому ...

3 ответа

 файлы, и хранить только основной файл.

аюсь скомпилировать проект CUDA, который кто-то прислал мне. Хотя этап компиляции проходит, этап компоновки не выполняется. Ниже приведен пример ошибки: Error 298 error LNK2005: "int __cdecl compare_ints(void const *,void const ...