¿Qué es la entropía cruzada?

Sé que hay muchas explicaciones de quécross-entropy es, pero todavía estoy confundido.

¿Es solo un método para describir la función de pérdida? Entonces, podemos usar, por ejemplo, el algoritmo de descenso de gradiente para encontrar el mínimo. ¿O es todo el proceso que implica también encontrar el algoritmo mínimo?