Funções trigonométricas especiais de precisão dupla CUDA para SFU

Eu queria saber como eu iria usar__cos(x) (e respectivamente__sin(x)) no código do kernel com CUDA. Eu olhei no manual CUDA que existe uma função de dispositivo, no entanto, quando eu implementá-lo o compilador apenas diz que eu não posso chamar uma função de host no dispositivo.

No entanto, descobri que existem duas funções irmãscosf(x) e__cosf(x) o último dos quais é executado no SFU e é em geral muito mais rápido que o originalcosf(x) função. O compilador não reclama do__cosf(x) função de curso.

Existe uma biblioteca que está faltando? Estou enganado sobre essa função trigonométrica?

questionAnswers(1)

yourAnswerToTheQuestion