CUBLAS - adição de matriz .. com

Estou tentando usar CUBLAS para somar duas grandes matrizes de tamanho desconhecido. Eu preciso de um código totalmente otimizado (se possível), portanto optei por não reescrever o código de adição da matriz (simples), mas usando CUBLAS, em particular a função cublasSgemm, que permite somar A e C (se B é uma matriz unitária): * C = alfa * op (A) * op (B) + beta * c *

O problema é: C e C ++ armazenam as matrizes no formato de linha principal, cublasSgemm (para compatibilidade fortran) deve funcionar no formato de coluna principal. Você pode especificar se A e B devem ser transpostos primeiro, mas você NÃO pode indicar a transposição C. Portanto, não consigo concluir minha adição de matriz ..

Não consigo transpor a matriz C sozinha porque a matriz é algo como o tamanho máximo de 20000x2000

Alguma idéia de como resolver, por favor?

questionAnswers(2)

yourAnswerToTheQuestion