Como escolher a perda de entropia cruzada no fluxo tensorial?
Problemas de classificação, como regressão logística ou regressão logística multinomial, otimizam umentropia cruzada perda. Normalmente, a camada de entropia cruzada segue osoftmax camada, que produz distribuição de probabilidade.
No fluxo tensor, há pelo menos umdúzia de diferentes funções de perda de entropia cruzada:
tf.losses.softmax_cross_entropy
tf.losses.sparse_softmax_cross_entropy
tf.losses.sigmoid_cross_entropy
tf.contrib.losses.softmax_cross_entropy
tf.contrib.losses.sigmoid_cross_entropy
tf.nn.softmax_cross_entropy_with_logits
tf.nn.sigmoid_cross_entropy_with_logits
...Quais funcionam apenas para classificação binária e quais são adequados para problemas com várias classes? Quando você deve usarsigmoid
ao invés desoftmax
? Como estásparse
funciona diferente dos outros e por que é apenassoftmax
?
Discussão relacionada (mais orientada à matemática):selva de entropia cruzada.