¿Dónde debo aplicar el abandono a una capa convolucional?
Debido a que la palabra "capa" a menudo significa cosas diferentes cuando se aplica a una capa convolucional (algunos tratan todo a través de la agrupación como una sola capa, otros tratan la convolución, la no linealidad y la agrupación como "capas" separadas;ver figura 9.7) no me queda claro dónde aplicar el abandono en una capa convolucional.
¿Ocurre el abandono entre la no linealidad y la agrupación?
Por ejemplo, en TensorFlow sería algo así como:
kernel_logits = tf.nn.conv2d(input_tensor, ...) + biases
activations = tf.nn.relu(kernel_logits)
kept_activations = tf.nn.dropout(activations, keep_prob)
output = pool_fn(kept_activations, ...)