Ты можешь сделать:

оложим, у меня есть логиты как

[[4.3, -0.5, -2.7, 0, 0], [0.5, 2.3, 0, 0, 0]]

где ясно, что последние два в первом примере и последние три во втором примере замаскированы и не должны влиять на вычисления потерь и градиента. Как рассчитать кросс-энтропийную потерю между этими логитами и соответствующими метками? Для здравомыслия, ярлыки для этого примера могут быть что-то вроде

[[1, 0, 0, 0, 0], [0, 1, 0, 0, 0]]

(Одна проблема: Softmax, за которым следует log, в логитах будет применим и для замаскированных нулей, и метод кросс-энтропии tf также учитывает потери для этих элементов.)

(Кроме того, вы можете думать о проблеме следующим образом: у меня есть логиты различной длины в пакете, то есть мои логиты были длины 3 и 2 для eg.1 и eg.2 соответственно. То же самое сопровождается метками.)

Ответы на вопрос(3)

Ваш ответ на вопрос