глубокое обучение - ряд наивных вопросов о кафе
Я пытаюсь понять основы кафе, в частности, использовать с питоном.
Насколько я понимаю, определение модели (скажем, данная архитектура нейронной сети) должно быть включено в'.prototxt'
файл.
И что, когда вы тренируете модель на данных, используя'.prototxt'
Вы сохраняете весовые / модельные параметры в'.caffemodel'
файл
Кроме того, есть разница между'.prototxt'
файл, используемый для обучения (который включает в себя скорость обучения и параметры регуляризации) и файл, используемый для тестирования / развертывания, который не включает их.
Вопросы:
это правильно, что'.prototxt'
является основой для обучения и что'.caffemodel'
является результатом обучения (веса), используя'.prototxt'
на тренировочных данных?это правильно, что есть'.prototxt'
для обучения и одного для тестирования, и что есть только небольшие различия (скорость обучения и факторы регуляризации при обучении), но что архитектура nn (при условии, что вы используете нейронные сети) одинакова?Извиняюсь за такие основные вопросы и, возможно, за некоторые очень неправильные предположения, я провожу некоторые онлайн-исследования, и строки выше суммируют мое понимание на сегодняшний день.