Caffe: Was kann ich tun, wenn nur ein kleiner Stapel in den Speicher passt?
Ich versuche ein sehr großes Modell zu trainieren. Daher kann ich nur eine sehr kleine Stapelgröße in den GPU-Speicher einpassen. Arbeiten mit kleinen Losgrößen führt zu sehrnoisy Gradientenschätzungen.
Was kann ich tun, um dieses Problem zu vermeiden?