¿Cuál es la forma canónica de verificar errores utilizando la API de tiempo de ejecución CUDA?

Revisando las respuestas y comentarios sobre las preguntas de CUDA, y en elEtiqueta wiki de CUDAVeo que a menudo se sugiere que el estado de retorno de cada llamada a la API debería verificar si hay errores. La documentación de la API contiene funciones comocudaGetLastError, cudaPeekAtLastErrorycudaGetErrorString, pero ¿cuál es la mejor manera de unirlos para detectar e informar errores de manera confiable sin requerir mucho código adicional?

Respuestas a la pregunta(4)

Su respuesta a la pregunta