Sumowanie wierszy macierzy (przechowywanych w kolejności rzędów lub kolumn) w CUDA
Pracuję nad problemem sumowania wierszy macierzy w CUDA. Podam następujący przykład.
Załóżmy, że mamy następujące20 * 4
szyk:
1 2 3 4
4 1 2 3
3 4 1 2
.
1 2 3 4
.
.
.
.
.
.
.
.
2 1 3 4
Po spłaszczeniu tablicy 2d do tablicy 1d (w kolejności rzędu lub kolejności kolumn), muszę przypisać każdy wątek do innego wiersza i obliczyć koszt dla tego wiersza.
Na przykład
- wątek 1 powinien obliczyć koszt1 2 3 4
- wątek 2 powinien obliczyć koszt4 1 2 3
Jak mogę to zrobić w CUDA?
Dziękuję wszystkim za odpowiedź