Результаты поиска по запросу "gpgpu"
Многопоточное обратное распространение
Я написал класс обратного распространения в VB.NET - он хорошо работает - и я использую его в проекте C # для искусственного интеллекта. Но у меня дома AMD Phenom X3 и Intel i5 в школе. и моя нейронная сеть не многопоточная. Как преобразовать ...
Декодировать видеокадры на iPhone GPU
Я ищу самый быстрый способ декодировать локальные кадры видео mpeg-4 на iPhone. Меня просто интересуют значения яркости пикселей в каждом 10-м кадре. Мне не нужно никуда рендерить видео. Я пробовал ffmpeg, AVAssetReader, ImageAssetGenerator, ...
Можно ли оптимизировать этот код OpenCL?
Я работаю над куском кода OpencL для специализированной матричной функции: дляDx1 векторv, дваDxD матрицыA а такжеB и постояннаяc, вернуть1xD векторr гдеr[i] = c * sum_over_j (v[j] * A[i][j] * B[i][j]) Ниже приведено то, что я имею до сих пор, ...
OpenCL извлекает глобальную память
Я думаю о переработке моего ядра GPU OpenCL, чтобы ускорить процесс. Проблема в том, что существует много глобальной памяти, которая не объединена, и выборки действительно снижают производительность. Поэтому я планирую скопировать как можно ...
Как вызвать функцию хоста в ядре CUDA?
Как следует из следующей ошибки, вызов функции хоста ('rand') в ядре недопустим, и мне интересно, есть ли решение для этого, если мне нужно это сделать. error: calling a host function("rand") from a __device__/__global__ function("xS_v1_cuda") ...
Можно ли использовать строковые типы данных в ядрах C ++ CUDA?
Я пишу ядро CUDA, в котором я используюstring тип данных в C ++. Однако компилятор выдает следующую ошибку: error: calling a host function("std::basic_string<char, std::char_traits<char>, std::allocator<char> >::operator =") from a ...
Компиляция кода CUDA из командной строки
Я пытаюсь скомпилировать код CUDA из командной строки, используя синтаксис: nvcc -c MyFile.cu -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 10.0\VC\bin"У меня установлен CUDA Toolkit версии 5.5, а также Visual C ++ 2010 Express. У меня ...
отправка трехмерного массива в ядро CUDA
Я взял код, указанный в качестве ответа дляКак я могу сложить два 2d (тональных) массива, используя вложенные циклы for? [https://stackoverflow.com/questions/6137218/cuda-2d-array-problem]и попытался использовать его для 3D вместо 2D и немного ...
OpenCL динамический параллелизм / порождения GPU?
CUDA 5только что был выпущен [http://nvidianews.nvidia.com/Releases/NVIDIA-Releases-CUDA-5-Making-Programming-With-World-s-Most-Pervasive-Parallel-Computing-Platform-Even-Easier-88b.aspx] и с этим возможность порождать потоки GPU из другого ...
Как динамически размещать массивы внутри ядра?
Мне нужно динамически распределять некоторые массивы внутри функции ядра. Как я могу это сделать? Мой код примерно такой: __global__ func(float *grid_d,int n, int nn){ int i,j; float x[n],y[nn]; //Do some really cool and heavy computations here ...