Znajdź max / min w CUDA bez przekazywania go do CPU
Muszę znaleźć indeks elementu maksymalnego w tablicy elementów pływających. Używam funkcji „cublasIsamax”, ale to zwraca indeks do procesora, a to spowalnia czas działania aplikacji.
Czy istnieje sposób na wydajne obliczenie tego indeksu i zapisanie go w GPU?
Dzięki!