Najprostszy wrapper CUDA dla początkujących

Chcę zacząć uczyć się, jak programować w CUDA, nie tylko w języku, ale projektowanie programów - takie jak - z tego, co słyszałem - pisanie kerneli bez warunkowych warunków, tak aby wszystkie wątki uruchamiały te same instrukcje i minimalne narzut synchronizacji.

Z tego, co słyszałem, opakowanie Pythona jest dużo bardziej intuicyjne w obsłudze i kodowaniu niż biblioteka C.

Zakładając więc, że języki, które już znam / nie wiem, nie są barierą, w jakim języku najlepiej rozpocząć naukę CUDA?

Który daje najlepszy pomysł na DO i DONT w CUDA i najłatwiejszą krzywą uczenia się?

questionAnswers(2)

yourAnswerToTheQuestion