Mittlere Auswahl im CUDA-Kernel
Ich muss den Median eines Arrays der Größe p in einem CUDA-Kernel berechnen (in meinem Fall ist p klein, z. B. p = 10). Ich verwende einen O (p ^ 2) -Algorithmus wegen seiner Einfachheit, aber auf Kosten der Zeitleistung.
Gibt es eine "Funktion", um den Median effizient zu finden, den ich in einem CUDA-Kernel aufrufen kann?
Ich weiß, dass ich einen Auswahlalgorithmus implementieren könnte, suche aber eine Funktion und / oder einen getesteten Code.
Vielen Dank!