Como observar eventos e métricas CUDA para uma subseção de um executável (por exemplo, apenas durante o tempo de execução do kernel)?

Estou familiarizado com o uso do nvprof para acessar os eventos e métricas de uma referência, por exemplo,

nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarkname

o

system-profiling on --print-gpu-trace -o (filename)    

O comando fornece registros de data e hora para hora de início, horário de término do kernel, energia, temperatura e salva as informações e arquivos nvvp para que possamos visualizá-las no visual profiler. Isso nos permite ver o que está acontecendo em qualquer seção de um código, especialmente quando um kernel específico está sendo executado. Minha pergunta é this--

Existe uma maneira de isolar os eventos contados para apenas uma seção da execução do benchmark, por exemplo, durante uma execução do kernel? No comando acima,

--events inst_issued1    

apenas fornece as instruções calculadas para todo o executável. Obrigado!

questionAnswers(2)

yourAnswerToTheQuestion