Tratamiento con condiciones de contorno / regiones de halo en CUDA

Estoy trabajando en el procesamiento de imágenes con CUDA y tengo dudas sobre el procesamiento de píxeles.

o que a menudo se hace con los píxeles de límite de una imagen cuando se aplica unam x m filtro de convolución?

En un3 x 3 núcleo de convolución, ignorando el1l límite de @ píxeles de la imagen es más fácil de manejar, especialmente cuando el código se mejora con la memoria compartida. De hecho, en este caso, no es necesario verificar si un píxel dado tiene toda la vecindad disponible (es decir, píxel en coord(0, 0) no ha dejado, vecinos superiores superiores izquierdos). Sin embargo, eliminando la1 el límite de píxeles de la imagen original podría generar resultados parciales.

rente a eso, me gustaría procesartodo los píxeles dentro de la imagen, también cuando se utilizan mejoras de memoria compartida, es decir, cargando16 x 16 píxeles, pero calculando el @ inter14 x 14. También en este caso, ignorar los píxeles del límite genera un código más claro.

¿Qué se suele hacer en este caso?

Alguien suele usar mi enfoque ignorando los píxeles del límite?

Por supuesto, sé que la respuesta depende del tipo de problema, es decir, agregar dos imágenes en píxeles no tiene este problema.

Gracias por adelantado