Resultados de la búsqueda a petición "q-learning"

3 la respuesta

Aumento ilimitado en Q-Value, consecuencia de la recompensa recurrente después de repetir la misma acción en Q-Learning

Estoy en el proceso de desarrollo de una implementación simple de Q-Learning sobre una aplicación trivial, pero hay algo que me sigue desconcertando.Consider...

5 la respuesta

¿Cómo puedo aplicar el aprendizaje por refuerzo a espacios de acción continua?

Estoy tratando de hacer que un agente aprenda los movimientos del mouse necesarios para realizar mejor alguna tarea en un entorno de aprendizaje de refuerzo (es decir, la señal de recompensa es la única respuesta para el aprendizaje). Espero ...