Como escolher a perda de entropia cruzada no fluxo tensorial?

Problemas de classificação, como regressão logística ou regressão logística multinomial, otimizam umentropia cruzada perda. Normalmente, a camada de entropia cruzada segue osoftmax camada, que produz distribuição de probabilidade.

No fluxo tensor, há pelo menos umdúzia de diferentes funções de perda de entropia cruzada:

tf.losses.softmax_cross_entropytf.losses.sparse_softmax_cross_entropytf.losses.sigmoid_cross_entropytf.contrib.losses.softmax_cross_entropytf.contrib.losses.sigmoid_cross_entropytf.nn.softmax_cross_entropy_with_logitstf.nn.sigmoid_cross_entropy_with_logits...

Quais funcionam apenas para classificação binária e quais são adequados para problemas com várias classes? Quando você deve usarsigmoid ao invés desoftmax? Como estásparse funciona diferente dos outros e por que é apenassoftmax?

Discussão relacionada (mais orientada à matemática):selva de entropia cruzada.

questionAnswers(2)

yourAnswerToTheQuestion