Programowanie CUDA - pamięci podręczne L1 i L2

Czy mógłbyś wyjaśnić różnice między używaniem pamięci podręcznych „L1 i L2” lub pamięci podręcznej „tylko L2” w programowaniu CUDA? Czego powinienem oczekiwać w czasie realizacji? Kiedy mogłem oczekiwać mniejszego czasu gpu? Kiedy włączam pamięć podręczną L1 i L2 lub po prostu włączam L2? dzięki

questionAnswers(1)

yourAnswerToTheQuestion