Wie erkläre ich Leistungsschwankungen über den PCIe-Bus?

In meinem CUDA-Programm sehe ich große Schwankungen zwischen verschiedenen Läufen (bis zu 50%) in der Kommunikationszeit, einschließlich der Datenübertragungszeiten von Host zu Gerät und von Gerät zu Host über PCI Express für angehefteten Speicher. Wie kann ich diese Variabilität erklären? Kommt es vor, wenn der PCI-Controller und der Speichercontroller gerade andere PCIe-Übertragungen durchführen? Jede Einsicht / Referenz wird sehr geschätzt. Die GPU ist Tesla K20c, der Host ist AMD Opteron 6168 mit 12 Kernen, auf denen das Linux-Betriebssystem ausgeführt wird. Die PCI Express-Version ist 2.0.

Antworten auf die Frage(2)

Ihre Antwort auf die Frage