¿Cómo es más eficiente el uso de la operación im2col en redes convolucionales?

Estoy tratando de implementar una red neuronal convolucional y no entiendo por qué usar la operación im2col es más eficiente. Básicamente almacena la entrada que se multiplicará por filtro en columnas separadas. Pero, ¿por qué no deberían usarse los bucles directamente para calcular la convolución en lugar de realizar primero im2col?

Respuestas a la pregunta(1)

Su respuesta a la pregunta