В результате может показаться, что нет способа профилировать код OpenCL, работающий на оборудовании NVIDIA, с использованием инструментария CUDA.
аюсь профилировать приложение OpenCL,a.out
, в системе с NVIDIA TITAN X и CUDA 8.0.
Если это было приложение CUDA,nvprof ./a.out
было бы достаточно. Но я обнаружил, что это не работает с приложением OpenCL с сообщением «Ядра не профилированы».
До CUDA 7.5 я успешно пользовалсяCOMPUTE_PROFILE=1
следующийэтот, К сожалению, в документации сказано: «Поддержка профилировщика командной строки с использованием переменной среды COMPUTE_PROFILE была прекращена в выпуске CUDA 8.0».
Вопрос в том, существует ли какой-либо способ, кроме понижения CUDA, для профилирования приложения OpenCL с помощью nvprof?