Os shaders da GPU Turing estão completos

Entendo que as GPUs completas são gigantes da computação - incluindo todas as etapas do cálculo e memória. Então, obviamente, uma GPU pode calcular o que quisermos - é Turing completo.

Minha pergunta é em relação a um único sombreador em várias GPUs ("Stream Processor" / "CUDA Core"):
Turing está completo?
Posso (em teoria) calcular uma função arbitrária sobre entradas arbitrárias usando um único sombreador?
Estou tentando entender em que "escala" de shaders de computação vivem.