Jak uruchomiono jądro CUDA?
Stworzyłem prostą aplikację CUDA, aby dodać dwie macierze. Kompiluje się dobrze. Chcę wiedzieć, jak jądro zostanie uruchomione przez wszystkie wątki i jaki będzie przepływ w CUDA? Mam na myśli, w jaki sposób każdy wątek wykona każdy element macierzy.
Wiem, że to bardzo podstawowe pojęcie, ale nie wiem tego. Jestem zdezorientowany co do przepływu.