Como criar um perfil do aplicativo OpenCL com CUDA 8.0 nvprof

Estou tentando criar um perfil do aplicativo OpenCL,a.out, em um sistema com NVIDIA TITAN X e CUDA 8.0.

Se fosse um aplicativo CUDA,nvprof ./a.out seria o suficiente. Mas descobri que isso não funciona com o aplicativo OpenCL, com a mensagem "Nenhum kernels foi perfilado".

Até CUDA 7.5, eu usei com sucessoCOMPUTE_PROFILE=1 Segueesta. Infelizmente, a documentação diz "O suporte ao criador de perfil de linha de comando usando a variável de ambiente COMPUTE_PROFILE foi descartado na versão CUDA 8.0".

A questão é: existe outra maneira além de fazer o downgrade do CUDA para criar um perfil do aplicativo OpenCL com o nvprof?

questionAnswers(1)

yourAnswerToTheQuestion