Podemos saber qual bloco / thread encontra o valor mínimo da memória do dispositivo?

cudaatomicMin operação parece apenas encontrar o valor mínimo de um tronco de memória do dispositivo. Mas existe alguma maneira de encontrar qual bloco / thread finalmente encontra esse valor mínimo? Eu tenho compute-2.0.