Suchergebnisse für Anfrage "reinforcement-learning"

3 die antwort

Uneingeschränkter Anstieg des Q-Werts, Folge der wiederkehrenden Belohnung nach Wiederholung derselben Aktion in Q-Learning

Ich bin gerade dabei, eine einfache Q-Learning-Implementierung über eine triviale Anwendung zu entwickeln, aber es gibt etwas, das mich immer wieder verwunde...

6 die antwort

Wie verwenden neuronale Netze genetische Algorithmen und Backpropagation, um Spiele zu spielen?

Ich bin auf @ gestoßdieses interessante Video auf YouTube über genetische Algorithmen [https://www.youtube.com/watch?v=u2t77mQmJiY]. Wie Sie im Video sehen können, lernen die Bots zu kämpfen. Nun, ich habe mich eine Weile mit neuronalen Netzen ...

2 die antwort

Markov Model Entscheidungsprozess in Java

Ich schreibe einen Assisted Learning-Algorithmus in Java. Ich bin auf ein mathematisches Problem gestoßen, das ich wahrscheinlich lösen kann, aber da die Verarbeitung sehr schwer sein wird, brauche ich eine optimale Lösung. Das heißt, wenn ...

TOP-Veröffentlichungen