Wyniki wyszukiwania dla "q-learning"

3 odpowiedź

Nieograniczony wzrost wartości Q, konsekwencja powtarzającej się nagrody po powtórzeniu tej samej akcji w Q-Learning

Jestem w trakcie opracowywania prostej implementacji Q-Learning nad banalną aplikacją, ale wciąż coś mnie zastanawia.Rozważmy standardowe sformułowanie Q-Lea...