¿El rendimiento de Nvidia Cuda warp Scheduler rinde?

He pasado porCuda guía de programación pero aún no está claro si una deformación cederá a favor de otra deformación lista para ejecutar? ¿Alguna explicación o puntero por favor? En caso afirmativo, ¿en qué condiciones produce una deformación?