Como criar um perfil do aplicativo OpenCL com CUDA 8.0 nvprof
Estou tentando criar um perfil do aplicativo OpenCL,a.out
, em um sistema com NVIDIA TITAN X e CUDA 8.0.
Se fosse um aplicativo CUDA,nvprof ./a.out
seria o suficiente. Mas descobri que isso não funciona com o aplicativo OpenCL, com a mensagem "Nenhum kernels foi perfilado".
Até CUDA 7.5, eu usei com sucessoCOMPUTE_PROFILE=1
Segueesta. Infelizmente, a documentação diz "O suporte ao criador de perfil de linha de comando usando a variável de ambiente COMPUTE_PROFILE foi descartado na versão CUDA 8.0".
A questão é: existe outra maneira além de fazer o downgrade do CUDA para criar um perfil do aplicativo OpenCL com o nvprof?