FFTs em lote usando cufftPlanMany

Eu quero realizar441 2D,32-by-32 FFTs usando o método em lote fornecido pela biblioteca cuFFT. Os parâmetros da transformação são os seguintes:

int n[2] = {32,32};
int inembed[] = {32,32};
int onembed[] = {32,32/2+1};

cufftPlanMany(&plan,2,n,inembed,1,32*32,onembed,1,32*(32/2+1),CUFFT_D2Z,441);
cufftPlanMany(&inverse_plan,2,n,onembed,1,32*32,inembed,1,32*32,CUFFT_Z2D,441);

Depois de executar as FFTs direta e inversa usando os planos acima, não consegui recuperar os dados originais.

Alguém pode me aconselhar como definir os parâmetros corretamente para cudaPlanMany? Muito obrigado antecipadamente.

A propósito, é a melhor maneira de usarcudaPlanMany para a minha situação?

questionAnswers(1)

yourAnswerToTheQuestion