Cómo usar la validación cruzada k-fold en una red neuronal

Estamos escribiendo un pequeño ANN que se supone que clasifica 7000 productos en 7 clases basadas en 10 variables de entrada.

Para hacer esto, tenemos que usar la validación cruzada k-fold pero estamos un poco confundidos.

Tenemos este extracto de la diapositiva de presentación:

¿Cuáles son exactamente los conjuntos de validación y prueba?

Por lo que entendemos es que corremos a través de los 3 conjuntos de entrenamiento y ajustamos los pesos (época única). Entonces, ¿qué hacemos con la validación? Porque por lo que entiendo es que el conjunto de prueba se utiliza para obtener el error de la red.

Lo que sucede después también me confunde. ¿Cuándo tiene lugar el crossover?

Si no es mucho pedir, se agradecería una lista de pasos con viñetas