Результаты поиска по запросу "cuda"

1 ответ

CUDA: в сокращении деформации и изменчивом ключевом слове

После прочтения вопроса и его ответа из следующего ССЫЛКА [https://stackoverflow.com/questions/12733084/cuda-why-is-warp-based-parallel-reduction-slower] У меня все еще есть вопрос, который остается в моей памяти. Из моего фона в C / C ++; Я ...

1 ответ

Проблемы с работой CUSPARSE

Поскольку я хотел скомпилировать свою программу (используя Cusparse), появились следующие строки: tmp / tmpxft_00001048_00000000-13_matvec.o: в функцииmain': tmpxft_00001048_00000000-1_matvec.cudafe1.cpp:(.text+0x6d5): undefined ...

3 ответа

CUDA: Почему побитовые операторы иногда быстрее, чем логические операторы?

Когда я собираюсь выжать из ядра последнюю часть производительности, я обычно нахожу заменулогические операторы (&& а также||) с участиемпобитовые операторы (& а также|) делает ядро немного быстрее. Это наблюдалось при просмотре сводки времени ...

ТОП публикаций

1 ответ

Для вложенных циклов с CUDA

У меня проблема с некоторыми вложенными циклами, которые мне нужно преобразовать из C / C ++ в CUDA. В основном у меня есть 4 для вложенных циклов, которые совместно используют один и тот же массив и выполняют операции сдвига битов. #define N ...

4 ответа

Как вызвать функцию хоста в ядре CUDA?

Как следует из следующей ошибки, вызов функции хоста ('rand') в ядре недопустим, и мне интересно, есть ли решение для этого, если мне нужно это сделать. error: calling a host function("rand") from a __device__/__global__ function("xS_v1_cuda") ...

2 ответа

Ошибка cudaMemset для переменной __device__

У меня проблемы с использованиемcudaMemset на переменную устройства. Можно ли использовать ссылку на переменную устройства дляcudaMemset, или это просто вопрос отсутствия флагов компилятора или библиотек .. Я использую cuda 4.1, и Версия NVRM: ...

3 ответа

Скомпилируйте код cuda для процессора

Я изучаю Cuda 5.5, но у меня нет графического процессора Nvidia. В старой версии nvcc есть флаг --multicore для компиляции кода cuda для процессора. В новой версии nvcc какой вариант ?? Я работаю над Linux.

2 ответа

Уменьшить столбцы матрицы с CUDA

У меня есть матрица, и я хотел бы использовать CUDA и максимально быстро вычислить среднее значение по столбцам (сводится к простой сумме), то есть вернуть вектор строки, содержащий среднее значение каждого столбца в этой матрице. Реализация ...

1 ответ

Поддерживаемые компиляторы Windows в CUDA

Я начинающий программист CUDA, пытаюсь начать, и я столкнулся с проблемой, упомянутой здесь, с версией 5.5 «чистая» ошибка с CUDA 5.5 в Visual Studio 2010 ...

1 ответ

Как скопировать древовидную структуру тетраэдра в память устройства CUDA?

Если я хочу переместить структуру нижеTetrahedronStruct в память устройства CUDA, как мне поступить? struct TetrahedronStruct { int index; int region; TriangleFaces Faces[4]; Vertex Vertices[4]; struct TetrahedronStruct *adjTetrahedrons[4]; }; ...