Mittlere Auswahl im CUDA-Kernel

Ich muss den Median eines Arrays der Größe p in einem CUDA-Kernel berechnen (in meinem Fall ist p klein, z. B. p = 10). Ich verwende einen O (p ^ 2) -Algorithmus wegen seiner Einfachheit, aber auf Kosten der Zeitleistung.

Gibt es eine "Funktion", um den Median effizient zu finden, den ich in einem CUDA-Kernel aufrufen kann?

Ich weiß, dass ich einen Auswahlalgorithmus implementieren könnte, suche aber eine Funktion und / oder einen getesteten Code.

Vielen Dank!

Antworten auf die Frage(2)

Ihre Antwort auf die Frage