nvprof Option für Bandbreite

Was ist die richtige Option zum Messen der Bandbreite mit nvprof --metrics von der Befehlszeile aus? Ich verwende flop_dp_efficiency, um den Prozentsatz der Spitzen-FLOPS zu ermitteln, aber es scheint viele Optionen für die Bandbreitenmessung im Handbuch zu geben, die ich nicht wirklich verstehe, was ich messe. z.B. dram_read, dram_write, gld_read, gld_write sehen für mich alle gleich aus. Sollte ich Bandbreite auch als Summe des Lese- und Schreibdurchsatzes angeben, indem ich annehme, dass beide gleichzeitig auftreten?

Bearbeiten

Basierend auf der ausgezeichneten Antwort mit dem Diagramm, welche Bandbreite würde vom Gerätespeicher zum Kernel gehen? Ich denke, um das Minimum der Bandbreite (Lesen + Schreiben) auf dem Weg vom Kernel zum Gerätespeicher zu nehmen, der wahrscheinlich dramatisch zum L2-Cache ist.

Ich versuche festzustellen, ob ein Kernel rechner- oder speichergebunden ist, indem ich FLOPS und Bandbreite messe.

Antworten auf die Frage(2)

Ihre Antwort auf die Frage