Softmax numéricamente estable

¿Hay una forma numéricamente estable de calcular la función softmax a continuación? Estoy obteniendo valores que se convierten en Nans en el código de red neuronal.

np.exp(x)/np.sum(np.exp(y))