Jak uruchomiono jądro CUDA?

Stworzyłem prostą aplikację CUDA, aby dodać dwie macierze. Kompiluje się dobrze. Chcę wiedzieć, jak jądro zostanie uruchomione przez wszystkie wątki i jaki będzie przepływ w CUDA? Mam na myśli, w jaki sposób każdy wątek wykona każdy element macierzy.

Wiem, że to bardzo podstawowe pojęcie, ale nie wiem tego. Jestem zdezorientowany co do przepływu.

questionAnswers(3)

yourAnswerToTheQuestion