¿Tensorflow explicación de gradiente denso?

Recientemente implementé un modelo y cuando lo ejecuté recibí esta advertencia:

UserWarning: Converting sparse IndexedSlices to a dense Tensor of unknown shape. 
This may consume a large amount of memory.
"Converting sparse IndexedSlices to a dense Tensor of unknown shape. "

Con algunas configuraciones de parámetros similares (incrustando dimensionalidades) de repente el modelo es ridículamente lento.

¿Qué implica esta advertencia? Parece que algo que he hecho ha causado que todos los gradientes sean densos, por lo que backprop está haciendo cálculos de matriz densosSi es que hay un problema con el modelo que está causando esto, ¿cómo puedo identificarlo y solucionarlo?

Respuestas a la pregunta(3)

Su respuesta a la pregunta