Suchergebnisse für Anfrage "reinforcement-learning"
Uneingeschränkter Anstieg des Q-Werts, Folge der wiederkehrenden Belohnung nach Wiederholung derselben Aktion in Q-Learning
Ich bin gerade dabei, eine einfache Q-Learning-Implementierung über eine triviale Anwendung zu entwickeln, aber es gibt etwas, das mich immer wieder verwunde...
Wie verwenden neuronale Netze genetische Algorithmen und Backpropagation, um Spiele zu spielen?
Ich bin auf @ gestoßdieses interessante Video auf YouTube über genetische Algorithmen [https://www.youtube.com/watch?v=u2t77mQmJiY]. Wie Sie im Video sehen können, lernen die Bots zu kämpfen. Nun, ich habe mich eine Weile mit neuronalen Netzen ...
Markov Model Entscheidungsprozess in Java
Ich schreibe einen Assisted Learning-Algorithmus in Java. Ich bin auf ein mathematisches Problem gestoßen, das ich wahrscheinlich lösen kann, aber da die Verarbeitung sehr schwer sein wird, brauche ich eine optimale Lösung. Das heißt, wenn ...