Как отлаживать функции тяги cuda в visual studio 2010 с помощью параллельного nsight
Я использую Visual Studio 2010, параллельные nsight 2.2 и cuda 4.2 для обучения. Моя система Windows 8 Pro x64. Я открыл проект сортировки radix, включенный cuda computing SDK в VS, и скомпилировал его без ошибок. Код сортировки использует библиотеку Thrust:
if(keysOnly)
thrust::sort(d_keys.begin(), d_keys.end());
else
thrust::sort_by_key(d_keys.begin(), d_keys.end(), d_values.begin());
Я хочу знать, как thrust отправляет функцию сортировки ядрам cuda, поэтому я попытался добавить точки останова перед строками выше и скомпилировал проект в режиме отладки. Но когда я использую параллельный nsight для отладки cuda, всегда возникают ошибки, которые "нет исходной корреспонденции для точки останова ".
Итак, мои проблемы:
Как отлаживать программы cuda thrust в visual studio с помощью параллельного nsight?Или есть кто-нибудь, кто может научить меня, используя другой способ узнать, как функции cuda thrust dipatch работают с ядрами cuda или другими функциями?Любой совет будет оценен!