Wie werden CUDA-Ereignisse und -Metriken für einen Unterabschnitt einer ausführbaren Datei überwacht (z. B. nur während einer Kernel-Ausführungszeit)?

Ich bin mit der Verwendung von nvprof vertraut, um auf die Ereignisse und Metriken eines Benchmarks zuzugreifen,

nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarkname

Da

system-profiling on --print-gpu-trace -o (filename)    

command gibt Zeitstempel für Startzeit, Kernel-Endzeit, Leistung und Temp an und speichert die Informationen und NVVP-Dateien, damit wir sie im visuellen Profiler anzeigen können. Auf diese Weise können wir sehen, was in einem beliebigen Codeabschnitt vor sich geht, insbesondere wenn ein bestimmter Kernel ausgeführt wird. Meine frage ist das -

Gibt es eine Möglichkeit, die Ereignisse, die nur für einen Teil des Benchmark-Laufs gezählt wurden, zu isolieren, z. B. während einer Kernel-Ausführung? Im obigen Befehl wird

--events inst_issued1    

just gibt die Anweisungen für die gesamte ausführbare Datei an. Vielen Dank

Antworten auf die Frage(4)

Ihre Antwort auf die Frage