Podemos saber qual bloco / thread encontra o valor mínimo da memória do dispositivo?
cudaatomicMin
operação parece apenas encontrar o valor mínimo de um tronco de memória do dispositivo. Mas existe alguma maneira de encontrar qual bloco / thread finalmente encontra esse valor mínimo? Eu tenho compute-2.0.