Результат сокращения OpenCL неправильный с большими числами
я использовалПример двухэтапного сокращения AMD для вычисления суммы всех чисел от 0 до 65 536 с использованием точности с плавающей запятой. К сожалению, результат не правильный. Однако, когда я изменяю свой код, чтобы вычислить сумму из 65 536 меньших чисел (например, 1), результат будет правильным.
Я не смог найти ошибку в коде. Возможно ли, что я получаю неправильные результаты из-за типа с плавающей точкой? Если это так, каков наилучший подход к решению проблемы?