Kernels exclusivos e simultâneos no mesmo multiprocessador?
É possível, usando fluxos, ter vários kernels exclusivos no mesmo multiprocessador de streaming nas GPUs Kepler 3.5? I.e. executar 30 kernels de tamanho<<<1,1024>>> ao mesmo tempo em uma GPU Kepler com 15 SMs?