aprendizaje profundo: una serie de preguntas ingenuas sobre caffe

Estoy tratando de entender los conceptos básicos de caffe, en particular para usar con python.

Entiendo que la definición del modelo (digamos una arquitectura de red neuronal dada) debe incluirse en el'.prototxt' archivo.

Y eso cuando entrenas el modelo en datos usando el'.prototxt', guarda los pesos / parámetros del modelo en un'.caffemodel' archivo

Además, hay una diferencia entre el'.prototxt' archivo utilizado para la capacitación (que incluye parámetros de velocidad de aprendizaje y regularización) y el utilizado para pruebas / implementación, que no los incluye.

Preguntas:

¿Es correcto que el'.prototxt' es la base para el entrenamiento y que el'.caffemodel' es el resultado del entrenamiento (pesas), usando el'.prototxt' en los datos de entrenamiento?¿Es correcto que haya un'.prototxt' para el entrenamiento y uno para las pruebas, y que solo hay ligeras diferencias (tasa de aprendizaje y factores de regularización en el entrenamiento), pero que la arquitectura nn (suponiendo que use redes neuronales) es la misma.

Disculpas por preguntas tan básicas y posiblemente algunas suposiciones muy incorrectas, estoy investigando en línea y las líneas anteriores resumen mi comprensión hasta la fecha.

Respuestas a la pregunta(2)

Su respuesta a la pregunta