Zmuszanie Renderscript do działania na procesorze lub GPU (Atleast do celów dostrajania wydajności)

mam kilkapodstawowy algorytmy (DCT / IDCT i kilka innych) przeniesione i działające (zgodnie z oczekiwaniami przynajmniej funkcjonalnie) na Nexusie 10. Ponieważ algorytmy te są pierwszymi implementacjami, ich czas wykonania jest obecnie uruchomiony na sekundy, co jest zrozumiałe.

Jednak biorąc pod uwagę architekturę Renderscript, widzę, że te algorytmy działają albo na CPU, albo na GPU, w zależności od innych równoległych działań aplikacji. Na przykład w mojej aplikacji istnieje przeglądanie obrazów i wszelka aktywność w tym widoku, co zasadniczo powoduje wykonanie renderscript na CPU. Jeśli nie ma aktywności, algorytm działa na GPU. Widzę to na żywo za pomocą śladów ARM-DS5 Mali / A15.

Sytuacja ta przedstawia się jako koszmar debugowania / strojenia, ponieważ delta wydajności, gdy algorytm działa na CPU (dwurdzeniowy) w porównaniu z GPU (Mali), jest rzędu 2 sekund, co sprawia, że ​​bardzo trudno jest ocenić poprawę wydajności, którą jestem robi na moim kodzie algorytmu.

czy istnieje sposób na obejście tego problemu? Jednym z możliwych rozwiązań jest przynajmniej opcja konfiguracji debugowania, aby wybrać typ docelowy (ARM, GPU) dla kodu renderscript?

questionAnswers(1)

yourAnswerToTheQuestion