В результате может показаться, что нет способа профилировать код OpenCL, работающий на оборудовании NVIDIA, с использованием инструментария CUDA.

аюсь профилировать приложение OpenCL,a.out, в системе с NVIDIA TITAN X и CUDA 8.0.

Если это было приложение CUDA,nvprof ./a.out было бы достаточно. Но я обнаружил, что это не работает с приложением OpenCL с сообщением «Ядра не профилированы».

До CUDA 7.5 я успешно пользовалсяCOMPUTE_PROFILE=1 следующийэтот, К сожалению, в документации сказано: «Поддержка профилировщика командной строки с использованием переменной среды COMPUTE_PROFILE была прекращена в выпуске CUDA 8.0».

Вопрос в том, существует ли какой-либо способ, кроме понижения CUDA, для профилирования приложения OpenCL с помощью nvprof?

Ответы на вопрос(1)

Ваш ответ на вопрос