Caffe: ¿qué sucederá si dos capas retroceden los gradientes al mismo blob inferior?

Me pregunto qué pasa si tengo una capa que genera una gota inferior que luego es consumida por dos capas posteriores, las cuales generarán algunos gradientes para llenar bottom.diff en la etapa de propagación posterior. ¿Se sumarán los dos gradientes para formar el gradiente final? ¿O solo uno de ellos puede vivir? Según tengo entendido, las capas de Caffe deben memorizar el fondo.diff a todos los ceros antes de llenarlo con algunos gradientes calculados, ¿verdad? ¿El memset eliminará los gradientes ya calculados por la otra capa? ¡Gracias!

Respuestas a la pregunta(1)

Su respuesta a la pregunta