Результаты поиска по запросу "opencl"

1 ответ

Блестящий ответ, большое спасибо! :)

у вас есть рабочие элементы, выполняющиеся в волновом фронте, и есть условие, такое как: if(x){ ... } else{ .... }Что выполняют рабочие элементы? это тот случай, когда все рабочие элементы в волновом фронте будут выполнять первую ветвь (т.е.x ...

1 ответ

 полагаться на это поведение, хотя.

чебника, который я пишу, я ищу «реалистичный» и простой пример тупика, вызванного незнанием SIMT / SIMD. Я придумал этот фрагмент, который, кажется, хороший пример. Любой вклад будет оценен. … int x = threadID / 2; if (threadID > x) { ...

4 ответа

время компиляции

чание: этот вопрос не имеет никакого отношения к OpenCL как таковому ... проверьте последний абзац для краткого изложения моего вопроса. Но, чтобы обеспечить некоторую справку: Я пишу код C ++, который использует OpenCL. Мне нравится хранить ...

ТОП публикаций

2 ответа

Доступен OpenCL на iOS

Я нашел эту тему на форумеМогут ли IPad или IPhone поддерживать OpenCL? [https://stackoverflow.com/questions/3258257/are-either-the-ipad-or-iphone-capable-of-opencl/5182480#5182480] но это довольно старый Кроме того, я могу понять, что OpenCL ...

6 ответов

Для CUDA (с использованием NVIDIA), пожалуйста, посмотрите B.4.5 Руководство по программированию Cuda от NVIDIA. Существует переменная для хранения этой информации. Вы можете запросить эту переменную во время выполнения. Для AMD я не уверен, есть ли такая переменная.

A есть концепциядеформироваться, которое определяется как максимальное количество потоков, которые могут выполнять одну и ту же инструкцию одновременно в пределах одного элемента обработки. Для NVIDIA этот размер деформации составляет 32 для всех ...

2 ответа

@nbro «Сокращение» - это когда вы берете много элементов (скажем, массив длиной 10 000, от [0] до [9999]), а затем обрабатываете данные в меньшем размере. Например: вычисление «максимального» числа в массиве или значения a [0] + a [1] + a [2] + ... a [9999]. Наиболее распространенными сокращениями являются «Макс», «Мин» и «Добавить», но концепция параллельной обработки большого и большого количества данных для вывода одного числа (или, по крайней мере, меньшего числа, представляющих целое) является общий «шаблон» в параллельном программировании.

ли какие-либо исследования, сравнивающие OpenCL с производительностью OpenMP? В частности, меня интересуют накладные расходы на запуск потоков с OpenCL, например, если нужно разложить домен на очень большое количество отдельных рабочих элементов ...

3 ответа

Вот

аюсь просто заставить базовую программу работать, используя clCreateProgramWithBinary. Это так, я знаю, как использовать его, а не «истинное» приложение. Я вижу, что одним из параметров является список двоичных файлов. Как именно я могу создать ...

1 ответ

Как правильно и наиболее эффективно использовать механизм отображения (без копирования) в среде Nvidia OpenCL?

Nvidia предложила пример того, как настроить пропускную способность между хостом и устройством, вы можете найти коды здесь:https://developer.nvidia.com/opencl [https://developer.nvidia.com/opencl](поиск "пропускная способность"). Эксперимент ...

1 ответ

Ошибка CL_INVALID_WORK_GROUP_SIZE

У меня есть этот код, для которого я уже что-то опубликовал некоторое время назад. Сегодня я запустил свое ядро со структурой typedef в небольшой тестовой программе, ноclEnqueueNDRangeKernel выдает неверный размер рабочей группы Это может иметь ...

10 ответов

OpenGL против OpenCL, что выбрать и почему?

Какие функции делают OpenCL уникальным выбором для расчетов над OpenGL с GLSL? Несмотря на связанную с графикой терминологию и непрактичные типы данных, есть ли реальное предостережение для OpenGL? Например, оценка параллельной функции может ...