Результаты поиска по запросу "nvidia"
для параллельного рендеринга это отличный проект.
имаюсь разработкой приложения OpenGL для Windows XP. Целевая машина имеет 2 видеокарты NVIDIA GeForce 9800GT, которые необходимы, потому что приложение должно иметь 2 потока аналогового видео. Само приложение имеет два окна OpenGL, по одному для ...
L2 кеш в Кеплере
Как работает кэш L2 в графических процессорах с архитектурой Kepler с точки зрения локальности ссылок? Например, если поток обращается к адресу в глобальной памяти, предполагая, что значение этого адреса отсутствует в кэше L2, как кэшируется ...
Куда мне обратиться, чтобы узнать магические числа, которые должны быть предоставлены nvapi_QueryInterface?
родолжение моего предыдущего вопроса:помогите с python ctypes и nvapi [https://stackoverflow.com/questions/6163770/help-with-python-ctypes-and-nvapi] Я публикую еще один вопрос, потому что я уже выбрал ответ в своем предыдущем вопросе, и теперь ...
@ SergeRogatch Да, я полагаю.
рограмма CUDA для вычисления в Монте-Карло вызывает сбой моего драйвера nvidia при превышении 500 проб и 256 полных блоков. Кажется, это происходит в функции ядра monteCarlo. Любая помощь приветствуется. #include <stdio.h> #include <stdlib.h> ...
Считается ли запись в глобальную память атомарной в CUDA?
Глобальная запись в память считается атомарной или нет в CUDA? Учитывая следующий код ядра CUDA: int idx = blockIdx.x*blockDim.x+threadIdx.x; int gidx = idx%1000; globalStorage[gidx] = somefunction(idx);Глобальная память пишет ...
файлы, и хранить только основной файл.
аюсь скомпилировать проект CUDA, который кто-то прислал мне. Хотя этап компиляции проходит, этап компоновки не выполняется. Ниже приведен пример ошибки: Error 298 error LNK2005: "int __cdecl compare_ints(void const *,void const ...
Мне нравится эта идея. Я буду продолжать искать, если это подтвердится.
атривая имя счетчиков производительности в архитектуре NVIDIA Fermi (файл Compute_profiler.txt в папке doc cuda), я заметил, что для пропусков кэша L2 есть два счетчика производительности: l2_subp0_read_sector_misses ...
Эффект __forceinline__ в функциях CUDA C __device__
Существует много советов о том, когда использовать встроенные функции и когда избегать этого в обычном кодировании на Си. Каков эффект от__forceinline__ на CUDA C__device__ функции? Где их следует использовать и где их следует избегать?
Как правильно и наиболее эффективно использовать механизм отображения (без копирования) в среде Nvidia OpenCL?
Nvidia предложила пример того, как настроить пропускную способность между хостом и устройством, вы можете найти коды здесь:https://developer.nvidia.com/opencl [https://developer.nvidia.com/opencl](поиск "пропускная способность"). Эксперимент ...
Ошибка компиляции CUDA из командной строки
Я пытаюсь скомпилировать тестовую программу cuda на Windows 7 через командную строку, я вот эта команда: nvcc test.cuНо все, что я получаю, это эта ошибка: nvcc fatal : Cannot find compiler 'cl.exe' in PATHЧто может быть причиной этой ошибки?