En CUDA, ¿qué es la fusión de memoria y cómo se logra?

¿Qué se "fusionó" en la transacción de memoria global de CUDA? No pude entender incluso después de leer mi guía CUDA. ¿Cómo hacerlo? En el ejemplo de matriz de guía de programación de CUDA, el acceso a la matriz fila por fila se llama "unido" o col .. por col .. se llama unido. ¿Cuál es correcto y por qué?

Respuestas a la pregunta(4)

Su respuesta a la pregunta