Resultados da pesquisa a pedido "q-learning"
Como aplicar o aprendizado por reforço em espaços de ação contínua?
Estou tentando convencer um agente a aprender os movimentos do mouse necessários para executar melhor uma tarefa em um ambiente de aprendizado por reforço (ou seja, o sinal de recompensa é o único feedback para o aprendizado Espero usar a ...