Mediana wyboru w jądrze CUDA

Muszę obliczyć medianę tablicy o rozmiarze p wewnątrz jądra CUDA (w moim przypadku p jest małe, np. P = 10). Używam algorytmu O (p ^ 2) ze względu na jego prostotę, ale kosztem wydajności czasu.

Czy istnieje „funkcja”, aby skutecznie znaleźć medianę, którą mogę wywołać w jądrze CUDA?

Wiem, że mogę zaimplementować algorytm wyboru, ale szukam funkcji i / lub sprawdzonego kodu.

Dzięki!

questionAnswers(2)

yourAnswerToTheQuestion