Jak korzystać z pamięci współdzielonej między wywołaniami jądra CUDA?

Chcę używać pamięci współdzielonej między wywołaniami jądra jednego jądra. Czy mogę korzystać z pamięci współdzielonej między połączeniami jądra?