OpenCL извлекает глобальную память

Я думаю о переработке моего ядра GPU OpenCL, чтобы ускорить процесс. Проблема в том, что существует много глобальной памяти, которая не объединена, и выборки действительно снижают производительность. Поэтому я планирую скопировать как можно больше глобальной памяти в локальную, но мне нужно выбрать, что копировать.

Теперь мой вопрос: много ли кусочков памяти повреждают больше, чем кусочки больших кусков?

Ответы на вопрос(3)

Ваш ответ на вопрос