Результаты поиска по запросу "cuda"
CUDA_ERROR_INVALID_IMAGE во время cuModuleLoad
Я создал очень простое ядро (можно найтиВот [https://gist.github.com/nesteruk/6591575]), который я успешно скомпилировал с помощью "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\bin\nvcc.exe" --cl-version 2012 -ccbin "C:\Program Files ...
нить
ел бы понять, как преобразовать основные циклы C / C ++ в ядро CUDA. Скажем так: for (int i=0;i < MAXi;i++) for(int j=0;j< MAXj;j++){ ...code that uses i and j.... }Все, что мне нужно, чтобы вычислить элементы MAXj. Это может быть ...
Это немного уродливо, но CUDA нужен механизм для передачи данных между RAM и GPU.
аюсь пройтиdevice_vector структур struct point { unsigned int x; unsigned int y; }к функции следующим образом: void print(thrust::device_vector<point> &points, unsigned int index) { std::cout << points[index].y << points[index].y << std::endl; ...
файлы, и хранить только основной файл.
аюсь скомпилировать проект CUDA, который кто-то прислал мне. Хотя этап компиляции проходит, этап компоновки не выполняется. Ниже приведен пример ошибки: Error 298 error LNK2005: "int __cdecl compare_ints(void const *,void const ...
внутри ветки?
асно ли использовать__syncthreads() в блоке, где я специально отбрасывал темы, используяreturn? В документации говорится, что__syncthreads() должен вызываться каждым потоком в блоке или это приведет к тупику, но на практике я никогда не ...
Межпроцессное взаимодействие CUDA
Я пытаюсь понять межпроцессное взаимодействие в CUDA. Мне нужна помощь в понимании этой концепции и попытке применить ее к проекту, который я делаю. У меня есть система получения изображений, которая обеспечивает N количество входных ...
Как передать 2-мерный массив в ядро в Pycuda?
Я нашел ответВот [https://stackoverflow.com/questions/13282596/how-do-i-feed-a-2-dimensional-array-into-a-kernel-with-pycuda] , но не ясно, если я должен изменить форму массива. Нужно ли переделывать 2d массив в 1d перед передачей его ядру pycuda?
был добавлен позже, после того как NVIDIA исправила CUDA, поэтому контекст может быть актуальным для более чем одного потока одновременно. Итак, я ожидаю, что ваш код будет работать нормально.
тоящее время я использую приложение, которое порождает кучу pthreads (linux), и каждое из них создает свой собственный контекст CUDA. (используя cuda 3.2 прямо сейчас). У меня проблема в том, что кажется, что каждый поток, имеющий свой ...
Смотрите ответ @talonmies
я создаю новый сеанс и говорю Visual Profiler запустить мои скрипты python / pycuda, я получаю следующее сообщение об ошибке:Execution run #1 of program '' failed, exit code: 255 Это мои предпочтения: Запуск:python ...
«родная поддержка». Дело в том, что __half2float является встроенным (я уверен, что он одноразовый), в то время как в SSE для правильной работы требуется много инструкций. Тот факт, что ALU является 32-битным, значения не имеет, половинки позволяют экономить память и пропускную способность памяти.
ли что-то с плавающей точкой с половиной точности в CUDA? Справочная информация: я хочу манипулировать текстурой opengl, используя glTexSubImage3D, с данными из PBO, которые я генерирую с помощью CUDA. Текстура хранится в формате GL_INTENSITY16 ...