Перекрывающиеся передачи и вычисления устройств в OpenCL

Я новичок в OpenCL, и мне сложно что-то понять. Я хочу улучшить передачу изображения между хостом и устройством. Я сделал схему, чтобы лучше понять меня.

Вверх: что у меня сейчас | Внизу: что я хочу HtD (хост-устройство) и DtH (устройство-хост) - это передачи памяти. К1 и К2 - ядра.

Я думал об использовании памяти отображения, но первая передача (хост на устройство) выполняется командой clSetKernelArg (), нет? Или мне нужно разрезать входное изображение на подизображение и использовать отображение для получения выходного изображения?

Благодарю.

Изменить: Больше информации

K1 обрабатывает входное изображение mem. K2 обрабатывает выходное изображение из K1.

Итак, я хочу перевести MemInput на несколько частей для K1. И я хочу прочитать и сохранить на хосте MemOuput, обработанный K2.

Ответы на вопрос(4)

Ваш ответ на вопрос