¿Dónde debo aplicar el abandono a una capa convolucional?

Debido a que la palabra "capa" a menudo significa cosas diferentes cuando se aplica a una capa convolucional (algunos tratan todo a través de la agrupación como una sola capa, otros tratan la convolución, la no linealidad y la agrupación como "capas" separadas;ver figura 9.7) no me queda claro dónde aplicar el abandono en una capa convolucional.

¿Ocurre el abandono entre la no linealidad y la agrupación?

Por ejemplo, en TensorFlow sería algo así como:

kernel_logits = tf.nn.conv2d(input_tensor, ...) + biases
activations = tf.nn.relu(kernel_logits)
kept_activations = tf.nn.dropout(activations, keep_prob)
output = pool_fn(kept_activations, ...)

Respuestas a la pregunta(1)

Su respuesta a la pregunta