Skąd mam wiedzieć, czy jądra wykonują się jednocześnie?

Mam procesor graficzny z CC 3.0, więc powinien obsługiwać 16 równoległych jąder. Uruchamiam 10 jąder przez pętlę przez clEnqueueNDRangeKernel przez 10 razy. Skąd mam wiedzieć, że jądra wykonują się jednocześnie?

Myślę, że jednym ze sposobów jest uzyskanie czasu przed i po instrukcji NDRangeKernel. Być może będę musiał użyć zdarzeń, aby zapewnić zakończenie działania jądra. Ale nadal uważam, że pętla uruchomi jądra sekwencyjnie. Czy ktoś może mi pomóc ...

questionAnswers(3)

yourAnswerToTheQuestion