Как наблюдать за событиями и показателями CUDA для подраздела исполняемого файла (например, только во время выполнения ядра)?
Я знаком с использованием nvprof для доступа к событиям и метрикам эталонного теста, например,
nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarkname
system-profiling on --print-gpu-trace -o (filename)
Команда выдает временные метки для времени начала, времени окончания ядра, мощности, температуры и сохраняет информацию в файлах nvvp, чтобы мы могли просматривать ее в визуальном профилировщике. Это позволяет нам видеть, что происходит в любом разделе кода, в частности, когда работает конкретное ядро. У меня вопрос такой-
Есть ли способ изолировать события, подсчитанные только для части выполнения теста, например, во время выполнения ядра? В приведенной выше команде
--events inst_issued1
просто дает инструкции для всего исполняемого файла. Спасибо!