Результаты поиска по запросу "cuda"

2 ответа

CUDA_ERROR_INVALID_IMAGE во время cuModuleLoad

Я создал очень простое ядро (можно найтиВот [https://gist.github.com/nesteruk/6591575]), который я успешно скомпилировал с помощью "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\bin\nvcc.exe" --cl-version 2012 -ccbin "C:\Program Files ...

1 ответ

нить

ел бы понять, как преобразовать основные циклы C / C ++ в ядро ​​CUDA. Скажем так: for (int i=0;i < MAXi;i++) for(int j=0;j< MAXj;j++){ ...code that uses i and j.... }Все, что мне нужно, чтобы вычислить элементы MAXj. Это может быть ...

2 ответа

Это немного уродливо, но CUDA нужен механизм для передачи данных между RAM и GPU.

аюсь пройтиdevice_vector структур struct point { unsigned int x; unsigned int y; }к функции следующим образом: void print(thrust::device_vector<point> &points, unsigned int index) { std::cout << points[index].y << points[index].y << std::endl; ...

ТОП публикаций

3 ответа

 файлы, и хранить только основной файл.

аюсь скомпилировать проект CUDA, который кто-то прислал мне. Хотя этап компиляции проходит, этап компоновки не выполняется. Ниже приведен пример ошибки: Error 298 error LNK2005: "int __cdecl compare_ints(void const *,void const ...

2 ответа

 внутри ветки?

асно ли использовать__syncthreads() в блоке, где я специально отбрасывал темы, используяreturn? В документации говорится, что__syncthreads() должен вызываться каждым потоком в блоке или это приведет к тупику, но на практике я никогда не ...

1 ответ

Межпроцессное взаимодействие CUDA

Я пытаюсь понять межпроцессное взаимодействие в CUDA. Мне нужна помощь в понимании этой концепции и попытке применить ее к проекту, который я делаю. У меня есть система получения изображений, которая обеспечивает N количество входных ...

1 ответ

Как передать 2-мерный массив в ядро в Pycuda?

Я нашел ответВот [https://stackoverflow.com/questions/13282596/how-do-i-feed-a-2-dimensional-array-into-a-kernel-with-pycuda] , но не ясно, если я должен изменить форму массива. Нужно ли переделывать 2d массив в 1d перед передачей его ядру pycuda?

1 ответ

 был добавлен позже, после того как NVIDIA исправила CUDA, поэтому контекст может быть актуальным для более чем одного потока одновременно. Итак, я ожидаю, что ваш код будет работать нормально.

тоящее время я использую приложение, которое порождает кучу pthreads (linux), и каждое из них создает свой собственный контекст CUDA. (используя cuda 3.2 прямо сейчас). У меня проблема в том, что кажется, что каждый поток, имеющий свой ...

1 ответ

Смотрите ответ @talonmies

я создаю новый сеанс и говорю Visual Profiler запустить мои скрипты python / pycuda, я получаю следующее сообщение об ошибке:Execution run #1 of program '' failed, exit code: 255 Это мои предпочтения: Запуск:python ...

1 ответ

 «родная поддержка». Дело в том, что __half2float является встроенным (я уверен, что он одноразовый), в то время как в SSE для правильной работы требуется много инструкций. Тот факт, что ALU является 32-битным, значения не имеет, половинки позволяют экономить память и пропускную способность памяти.

ли что-то с плавающей точкой с половиной точности в CUDA? Справочная информация: я хочу манипулировать текстурой opengl, используя glTexSubImage3D, с данными из PBO, которые я генерирую с помощью CUDA. Текстура хранится в формате GL_INTENSITY16 ...