Как наблюдать за событиями и показателями CUDA для подраздела исполняемого файла (например, только во время выполнения ядра)?

Я знаком с использованием nvprof для доступа к событиям и метрикам эталонного теста, например,

nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarkname

system-profiling on --print-gpu-trace -o (filename)    

Команда выдает временные метки для времени начала, времени окончания ядра, мощности, температуры и сохраняет информацию в файлах nvvp, чтобы мы могли просматривать ее в визуальном профилировщике. Это позволяет нам видеть, что происходит в любом разделе кода, в частности, когда работает конкретное ядро. У меня вопрос такой-

Есть ли способ изолировать события, подсчитанные только для части выполнения теста, например, во время выполнения ядра? В приведенной выше команде

--events inst_issued1    

просто дает инструкции для всего исполняемого файла. Спасибо!

Ответы на вопрос(2)

Ваш ответ на вопрос