¿Cómo elegir la pérdida de entropía cruzada en tensorflow?

Los problemas de clasificación, como la regresión logística o la regresión logística multinomial, optimizan unentropía cruzada pérdida. Normalmente, la capa de entropía cruzada sigue elsoftmax capa, que produce distribución de probabilidad.

En tensorflow, hay al menos undocenas de diferentes funciones de pérdida de entropía cruzada:

tf.losses.softmax_cross_entropytf.losses.sparse_softmax_cross_entropytf.losses.sigmoid_cross_entropytf.contrib.losses.softmax_cross_entropytf.contrib.losses.sigmoid_cross_entropytf.nn.softmax_cross_entropy_with_logitstf.nn.sigmoid_cross_entropy_with_logits...

¿Qué funciona solo para la clasificación binaria y cuáles son adecuados para problemas de varias clases? Cuando deberías usarsigmoid en lugar desoftmax? Como sonsparse funciona diferente de los demás y por qué es solosoftmax?

Discusión relacionada (más orientada a las matemáticas):selva de entropía cruzada.

Respuestas a la pregunta(2)

Su respuesta a la pregunta