CUDA: функция профиля Nsight VS2010 __device__
Я хотел бы знать, как профилировать__device__
функция, которая находится внутри__global__
работать с Nsight 2.2 на visual studio 2010. Мне нужно знать, какая функция отнимает много ресурсов и времени. У меня CUDA 5.0 на CC 2.0.