Результаты поиска по запросу "gpu"

имаю, как писать программы для OpenGL / DirectX, и я знаю математику и концептуальные вещи, стоящие за ней, но мне любопытно, как связь между процессором и GPU работает на низком уровне. Скажем, у меня есть программа OpenGL, написанная на C, ...

gpgpu c++cuda

2 ответа

Ой. (подразумеваемые объяснения) Желание, которое было заявлено более заметно. Спасибо @talonmies.

ал писать новое приложение CUDA. Однако я попал в забавный обходной путь. Вызов первого cudaMalloc для переменной x завершается неудачно в первый раз. Однако, когда я вызываю его во второй раз, он возвращает cudaSuccess. Недавно обновленный до ...

coalesce shared-memory

1 ответ

Еще раз спасибо Я мог бы обнаружить, что для доступа к «глобальной» памяти объединение (соседние) адреса памяти, которые требуются потокам, является ключом, в то время как в «разделяемой» памяти ключом являются не конфликтующие адреса, выданные потоками. Я прав?

я есть «N» потоки для одновременного выполнения на устройстве, которое им нужно, чтобы M * N плавали из глобальной памяти. Как правильно соединить глобальную память? В этом вопросе, как общая память может помочь?

ТОП публикаций

10 Food Delivery Startups to Watch for in 2020

7 Best Telemedicine Apps In 2020

How to Build a Live Streaming Video App and Reach Founder’s Zen

19 Tools And Resources to Build an MVP From Scratch

c++cuda thrust

2 ответа

Это немного уродливо, но CUDA нужен механизм для передачи данных между RAM и GPU.

аюсь пройтиdevice_vector структур struct point { unsigned int x; unsigned int y; }к функции следующим образом: void print(thrust::device_vector<point> &points, unsigned int index) { std::cout << points[index].y << points[index].y << std::endl; ...

nvidia gpgpu gpu-programming cuda

3 ответа

файлы, и хранить только основной файл.

аюсь скомпилировать проект CUDA, который кто-то прислал мне. Хотя этап компиляции проходит, этап компоновки не выполняется. Ниже приведен пример ошибки: Error 298 error LNK2005: "int __cdecl compare_ints(void const *,void const ...

direct3d xna 3d directx

1 ответ

Спасибо за ваш ответ, это очень помогло, это именно то, что мне было нужно!

у графический движок на основе графа сцены для моделирования. Я использую XNA 4. Во многих местах, которые я читал, изменения текстуры (и другие изменения состояния) должны быть минимизированы во время рендеринга (поэтому я должен упорядочить ...

opencv

2 ответа

Это сработало для меня!

ю, как сделать противоположное, то есть получитьGpuMat изCvMat с помощью загрузки, но мне нужноCvMat изGpuMatЕсть ли способ, который может быть использован для этого?

nvidia gpgpu cuda

2 ответа

Мне нравится эта идея. Я буду продолжать искать, если это подтвердится.

атривая имя счетчиков производительности в архитектуре NVIDIA Fermi (файл Compute_profiler.txt в папке doc cuda), я заметил, что для пропусков кэша L2 есть два счетчика производительности: l2_subp0_read_sector_misses ...

opencl gpgpu

6 ответов

Для CUDA (с использованием NVIDIA), пожалуйста, посмотрите B.4.5 Руководство по программированию Cuda от NVIDIA. Существует переменная для хранения этой информации. Вы можете запросить эту переменную во время выполнения. Для AMD я не уверен, есть ли такая переменная.

A есть концепциядеформироваться, которое определяется как максимальное количество потоков, которые могут выполнять одну и ту же инструкцию одновременно в пределах одного элемента обработки. Для NVIDIA этот размер деформации составляет 32 для всех ...

cuda gpgpu

1 ответ

Я думаю, что в большинстве случаев конфликты совместно используемых банков играют основную часть повторов, затем глобальные повторы памяти, затем другие конфликты, такие как постоянные конфликты памяти, пропуски кэша команд и т. Д. К сожалению, официальной информации об этом нет.

учил информацию от CUDA Profiler. Я так растерялся, почему Replays Instruction! = Воспроизведение памяти Grobal + воспроизведение локальной памяти + воспроизведение конфликта общего банка? Смотрите следующую информацию, которую я получил от ...

Страница 16 из 20

14 151617 18

Результаты поиска по запросу "gpu"

Что может быть разумным отношением, если бы этот вопрос не касался скрытых деталей.

Ой. (подразумеваемые объяснения) Желание, которое было заявлено более заметно. Спасибо @talonmies.

Популярные теги

ТОП публикаций

Это немного уродливо, но CUDA нужен механизм для передачи данных между RAM и GPU.

файлы, и хранить только основной файл.

Спасибо за ваш ответ, это очень помогло, это именно то, что мне было нужно!

Это сработало для меня!

Мне нравится эта идея. Я буду продолжать искать, если это подтвердится.

Вы очень активны! Это здорово!

Результаты поиска по запросу "gpu"

Популярные теги

ТОП публикаций