Funções trigonométricas especiais de precisão dupla CUDA para SFU
Eu queria saber como eu iria usar__cos(x)
(e respectivamente__sin(x)
) no código do kernel com CUDA. Eu olhei no manual CUDA que existe uma função de dispositivo, no entanto, quando eu implementá-lo o compilador apenas diz que eu não posso chamar uma função de host no dispositivo.
No entanto, descobri que existem duas funções irmãscosf(x)
e__cosf(x)
o último dos quais é executado no SFU e é em geral muito mais rápido que o originalcosf(x)
função. O compilador não reclama do__cosf(x)
função de curso.
Existe uma biblioteca que está faltando? Estou enganado sobre essa função trigonométrica?