Cuál es la forma más eficiente de implementar un filtro de convolución dentro de un sombreador de píxeles?

a implementación de convolución en un sombreador de píxeles es algo costosa en cuanto a la gran cantidad de recuperaciones de textura.

na forma directa de implementar un filtro de convolución es hacer queN x N búsquedas por fragmento utilizando dos ciclos por fragmento. Un cálculo simple dice que una imagen de 1024x1024 borrosa con un núcleo gaussiano 4x4 necesitaría1024 x 1024 x 4 x 4 = 16M búsquedas.

¿Qué se puede hacer al respecto?

Se puede utilizar alguna optimización que necesite menos búsquedas? No estoy interesado en optimizaciones específicas del kernel como las de Gauss (¿o son específicas del kernel?) ¿Se puede al menos hacer estas búsquedas más rápidas explotando de alguna manera la localidad de los píxeles con los que se trabajaría?

¡Gracias

Respuestas a la pregunta(3)

Su respuesta a la pregunta