Como observar eventos e métricas CUDA para uma subseção de um executável (por exemplo, apenas durante o tempo de execução do kernel)?
Estou familiarizado com o uso do nvprof para acessar os eventos e métricas de uma referência, por exemplo,
nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarkname
o
system-profiling on --print-gpu-trace -o (filename)
O comando fornece registros de data e hora para hora de início, horário de término do kernel, energia, temperatura e salva as informações e arquivos nvvp para que possamos visualizá-las no visual profiler. Isso nos permite ver o que está acontecendo em qualquer seção de um código, especialmente quando um kernel específico está sendo executado. Minha pergunta é this--
Existe uma maneira de isolar os eventos contados para apenas uma seção da execução do benchmark, por exemplo, durante uma execução do kernel? No comando acima,
--events inst_issued1
apenas fornece as instruções calculadas para todo o executável. Obrigado!