Duże mnożenie macierzy na gpu
Muszę zaimplementować mnożenie macierzy na GPU z CUDA dla dużych macierzy. Rozmiar każdej macierzy jest większy niż pamięć GPU. Myślę, że potrzebuję algorytmu, aby to zrobić efektywnie. Chodziłem po Internecie, ale nie mogłem znaleźć żadnego. Czy ktoś może podać mi nazwę lub link do takich algorytmów.
Dziękuję Ci