cublasgeam был добавлен в CUBLAS5.0. Он вычисляет взвешенную сумму 2 необязательно транспонированных матриц

аюсь использовать CUBLAS для суммирования двух больших матриц неизвестного размера. Мне нужен полностью оптимизированный код (если возможно), поэтому я решил не переписывать код сложения матрицы (простой), а использовать CUBLAS, в частности функцию cublasSgemm, которая позволяет суммировать A и C (если B - единичная матрица): * C = альфа * оп (A) * оп (B) + бета * с *

Проблема в том, что C и C ++ хранят матрицы в формате строки-строки, cublasSgemm предназначен (для совместимости с Fortran) для работы в формате строки-столбца. Вы можете указать, должны ли A и B быть транспонированы первыми, но вы НЕ можете указать, чтобы транспонировать C. Поэтому я не могу завершить добавление моей матрицы.

Я не могу самостоятельно перенести матрицу C, потому что она имеет максимальный размер 20000x20000.

Любая идея о том, как решить, пожалуйста?

Ответы на вопрос(2)

Ваш ответ на вопрос