¡Eres muy activo! ¡Es genial!

Question

He estado tratando de implementar la versión softmax de la pérdida de triplete en Caffe descrita en
Hoffer y Ailon,Aprendizaje métrico profundo utilizando la red Triplet, ICLR 2015.

neural-network
deep-learning
softmax
caffe
gradient-descent

He intentado esto pero me resulta difícil calcular el gradiente ya que el exponente L2 no es cuadrado.

¿Puede alguien ayudarme aquí?

Respuestas a la pregunta(2)

¿Por qué foreach aumenta refcount en 2 en lugar de 1?

Gradle build.gradle a Maven pom.xml

¿Los navegadores móviles no admiten variables de sesión?

¿Cómo guardar los datos editados de JTable en la base de datos?

Obtén todas las claves de Chrome Storage