¿Cuál es una derivada de la función de activación utilizada en la retropropagación?

Question

Mar 20, 2012, 12:19 PM

math artificial-intelligence neural-network machine-learning

¿Cuál es una derivada de la función de activación utilizada en la retropropagación?

Estoy leyendoest document, y declararon que la fórmula de ajuste de peso es esta:

nuevo peso = peso antiguo + tasa de aprendizaje * delta * df (e) / de * input

Losdf(e)/de part es la derivada de la función de activación, que generalmente es una función sigmoidea comotanh. Ahora, ¿para qué es esto realmente? ¿Por qué nos estamos multiplicando con eso? ¿Por qué no sololearning rate * delta * input ¿suficiente

Esta pregunta vino después de esta y está estrechamente relacionada con ella: ¿Por qué se debe utilizar una función de activación no lineal en una red neuronal de propagación hacia atrás?.

Respuestas a la pregunta(4)

Preguntas populares

0 la respuesta

Hacer la aplicación web php segura

0 la respuesta

Spring Security: habilite / deshabilite CSRF por tipo de cliente (navegador / no navegador)

0 la respuesta

¿Cómo instalar paquetes atmosféricos sin meteorito?

0 la respuesta

Omitir filtro en una acción particular cuando el filtro de acción se registra globalmente

0 la respuesta

Acceso a GCP Memorystore desde máquinas locales

¡Eres muy activo! ¡Es genial!

¿Cuál es una derivada de la función de activación utilizada en la retropropagación?

Respuestas a la pregunta(4)

Su respuesta a la pregunta

Preguntas populares