нормально даже с Адамом. Похоже, у меня была ошибка, но я не могу вспомнить проблему там.
ользую CNN для задачи регрессии. Я использую Tensorflow и оптимизатором является Адам. Сеть, кажется, прекрасно сходится до одной точки, где потеря внезапно увеличивается вместе с ошибкой проверки. Вот графики потерь меток и разделенных весов (Оптимизатор запускается на их сумму)
Я использую потерю l2 для регуляризации веса, а также для этикеток. Я применяю некоторую случайность к тренировочным данным. В настоящее время я пытаюсь RSMProp, чтобы увидеть, если поведение меняется, но для воспроизведения ошибки требуется не менее 8 часов.
Я хотел бы понять, как это может произойти. Надеюсь, ты сможешь мне помочь.