Результаты поиска по запросу "gpgpu"

2 ответа

Многопоточное обратное распространение

Я написал класс обратного распространения в VB.NET - он хорошо работает - и я использую его в проекте C # для искусственного интеллекта. Но у меня дома AMD Phenom X3 и Intel i5 в школе. и моя нейронная сеть не многопоточная. Как преобразовать ...

3 ответа

Декодировать видеокадры на iPhone GPU

Я ищу самый быстрый способ декодировать локальные кадры видео mpeg-4 на iPhone. Меня просто интересуют значения яркости пикселей в каждом 10-м кадре. Мне не нужно никуда рендерить видео. Я пробовал ffmpeg, AVAssetReader, ImageAssetGenerator, ...

1 ответ

Можно ли оптимизировать этот код OpenCL?

Я работаю над куском кода OpencL для специализированной матричной функции: дляDx1 векторv, дваDxD матрицыA а такжеB и постояннаяc, вернуть1xD векторr гдеr[i] = c * sum_over_j (v[j] * A[i][j] * B[i][j]) Ниже приведено то, что я имею до сих пор, ...

ТОП публикаций

3 ответа

OpenCL извлекает глобальную память

Я думаю о переработке моего ядра GPU OpenCL, чтобы ускорить процесс. Проблема в том, что существует много глобальной памяти, которая не объединена, и выборки действительно снижают производительность. Поэтому я планирую скопировать как можно ...

4 ответа

Как вызвать функцию хоста в ядре CUDA?

Как следует из следующей ошибки, вызов функции хоста ('rand') в ядре недопустим, и мне интересно, есть ли решение для этого, если мне нужно это сделать. error: calling a host function("rand") from a __device__/__global__ function("xS_v1_cuda") ...

1 ответ

Можно ли использовать строковые типы данных в ядрах C ++ CUDA?

Я пишу ядро CUDA, в котором я используюstring тип данных в C ++. Однако компилятор выдает следующую ошибку: error: calling a host function("std::basic_string<char, std::char_traits<char>, std::allocator<char> >::operator =") from a ...

1 ответ

Компиляция кода CUDA из командной строки

Я пытаюсь скомпилировать код CUDA из командной строки, используя синтаксис: nvcc -c MyFile.cu -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 10.0\VC\bin"У меня установлен CUDA Toolkit версии 5.5, а также Visual C ++ 2010 Express. У меня ...

1 ответ

отправка трехмерного массива в ядро CUDA

Я взял код, указанный в качестве ответа дляКак я могу сложить два 2d (тональных) массива, используя вложенные циклы for? [https://stackoverflow.com/questions/6137218/cuda-2d-array-problem]и попытался использовать его для 3D вместо 2D и немного ...

1 ответ

OpenCL динамический параллелизм / порождения GPU?

CUDA 5только что был выпущен [http://nvidianews.nvidia.com/Releases/NVIDIA-Releases-CUDA-5-Making-Programming-With-World-s-Most-Pervasive-Parallel-Computing-Platform-Even-Easier-88b.aspx] и с этим возможность порождать потоки GPU из другого ...

5 ответов

Как динамически размещать массивы внутри ядра?

Мне нужно динамически распределять некоторые массивы внутри функции ядра. Как я могу это сделать? Мой код примерно такой: __global__ func(float *grid_d,int n, int nn){ int i,j; float x[n],y[nn]; //Do some really cool and heavy computations here ...