Onde devo aplicar a desistência a uma camada convolucional?

Como a palavra "camada" geralmente significa coisas diferentes quando aplicada a uma camada convolucional (algumas tratam tudo através do agrupamento como uma única camada, outras tratam convolução, não linearidade e agrupamento como "camadas" separadas;ver fig 9.7) não está claro para mim onde aplicar a desistência em uma camada convolucional.

O abandono acontece entre a não linearidade e o pool?

Por exemplo, no TensorFlow, seria algo como:

kernel_logits = tf.nn.conv2d(input_tensor, ...) + biases
activations = tf.nn.relu(kernel_logits)
kept_activations = tf.nn.dropout(activations, keep_prob)
output = pool_fn(kept_activations, ...)

questionAnswers(1)

yourAnswerToTheQuestion