Результаты поиска по запросу "gpu"

4 ответа

Что может быть разумным отношением, если бы этот вопрос не касался скрытых деталей.

имаю, как писать программы для OpenGL / DirectX, и я знаю математику и концептуальные вещи, стоящие за ней, но мне любопытно, как связь между процессором и GPU работает на низком уровне. Скажем, у меня есть программа OpenGL, написанная на C, ...

2 ответа

Ой. (подразумеваемые объяснения) Желание, которое было заявлено более заметно. Спасибо @talonmies.

ал писать новое приложение CUDA. Однако я попал в забавный обходной путь. Вызов первого cudaMalloc для переменной x завершается неудачно в первый раз. Однако, когда я вызываю его во второй раз, он возвращает cudaSuccess. Недавно обновленный до ...

1 ответ

Еще раз спасибо Я мог бы обнаружить, что для доступа к «глобальной» памяти объединение (соседние) адреса памяти, которые требуются потокам, является ключом, в то время как в «разделяемой» памяти ключом являются не конфликтующие адреса, выданные потоками. Я прав?

я есть «N» потоки для одновременного выполнения на устройстве, которое им нужно, чтобы M * N плавали из глобальной памяти. Как правильно соединить глобальную память? В этом вопросе, как общая память может помочь?

ТОП публикаций

2 ответа

Это немного уродливо, но CUDA нужен механизм для передачи данных между RAM и GPU.

аюсь пройтиdevice_vector структур struct point { unsigned int x; unsigned int y; }к функции следующим образом: void print(thrust::device_vector<point> &points, unsigned int index) { std::cout << points[index].y << points[index].y << std::endl; ...

3 ответа

 файлы, и хранить только основной файл.

аюсь скомпилировать проект CUDA, который кто-то прислал мне. Хотя этап компиляции проходит, этап компоновки не выполняется. Ниже приведен пример ошибки: Error 298 error LNK2005: "int __cdecl compare_ints(void const *,void const ...

1 ответ

Спасибо за ваш ответ, это очень помогло, это именно то, что мне было нужно!

у графический движок на основе графа сцены для моделирования. Я использую XNA 4. Во многих местах, которые я читал, изменения текстуры (и другие изменения состояния) должны быть минимизированы во время рендеринга (поэтому я должен упорядочить ...

2 ответа

Это сработало для меня!

ю, как сделать противоположное, то есть получитьGpuMat изCvMat с помощью загрузки, но мне нужноCvMat изGpuMatЕсть ли способ, который может быть использован для этого?

2 ответа

Мне нравится эта идея. Я буду продолжать искать, если это подтвердится.

атривая имя счетчиков производительности в архитектуре NVIDIA Fermi (файл Compute_profiler.txt в папке doc cuda), я заметил, что для пропусков кэша L2 есть два счетчика производительности: l2_subp0_read_sector_misses ...

6 ответов

Для CUDA (с использованием NVIDIA), пожалуйста, посмотрите B.4.5 Руководство по программированию Cuda от NVIDIA. Существует переменная для хранения этой информации. Вы можете запросить эту переменную во время выполнения. Для AMD я не уверен, есть ли такая переменная.

A есть концепциядеформироваться, которое определяется как максимальное количество потоков, которые могут выполнять одну и ту же инструкцию одновременно в пределах одного элемента обработки. Для NVIDIA этот размер деформации составляет 32 для всех ...

1 ответ

Я думаю, что в большинстве случаев конфликты совместно используемых банков играют основную часть повторов, затем глобальные повторы памяти, затем другие конфликты, такие как постоянные конфликты памяти, пропуски кэша команд и т. Д. К сожалению, официальной информации об этом нет.

учил информацию от CUDA Profiler. Я так растерялся, почему Replays Instruction! = Воспроизведение памяти Grobal + воспроизведение локальной памяти + воспроизведение конфликта общего банка? Смотрите следующую информацию, которую я получил от ...