Resultados da pesquisa a pedido "q-learning"

3 a resposta

Aumento ilimitado do Q-Value, consequência da recompensa recorrente após repetir a mesma ação no Q-Learning

5 a resposta

Como aplicar o aprendizado por reforço em espaços de ação contínua?

Estou tentando convencer um agente a aprender os movimentos do mouse necessários para executar melhor uma tarefa em um ambiente de aprendizado por reforço (ou seja, o sinal de recompensa é o único feedback para o aprendizado Espero usar a ...