Woher weiß ich, ob die Kernel gleichzeitig ausgeführt werden?

Ich habe eine GPU mit CC 3.0, daher sollte sie 16 gleichzeitige Kernel unterstützen. Ich starte 10 Kernel, indem ich 10 Mal durch clEnqueueNDRangeKernel schleife. Wie erfahre ich, dass die Kernel gleichzeitig ausgeführt werden?

Eine Möglichkeit, über die ich nachgedacht habe, besteht darin, die Zeit vor und nach der NDRangeKernel-Anweisung abzurufen. Eventuell muss ich Ereignisse verwenden, um sicherzustellen, dass die Ausführung des Kernels abgeschlossen ist. Aber ich habe immer noch das Gefühl, dass die Schleife die Kernel nacheinander startet. Kann mir jemand weiterhelfen ..

Antworten auf die Frage(3)

Ihre Antwort auf die Frage