Как оптимизировать статистику гистограммы с помощью неоновых присадок?

Я хочу оптимизировать статистический код гистограммы с помощью неоновых встроенных функций. Но мне это не удалось. Вот код c:

#define NUM (7*1024*1024)
uint8 src_data[NUM];
uint32 histogram_result[256] = {0};
for (int i = 0; i < NUM; i++)
{
    histogram_result[src_data[i]]++;
}

Статистика по гисторам больше похожа на последовательную обработку. С неоновыми внутренностями сложно оптимизировать. Кто-нибудь знает, как оптимизировать? Заранее спасибо.

Ответы на вопрос(1)

Ваш ответ на вопрос