Если вы находитесь в состоянии 1, вы (при условии жадной стратегии) выберете действие 1. Если вы находитесь в состоянии 2, вы выберете действие 2.

Question

Sep 17, 2017, 06:52 AM

Если вы находитесь в состоянии 1, вы (при условии жадной стратегии) выберете действие 1. Если вы находитесь в состоянии 2, вы выберете действие 2.

ел такие слова как:

Политика определяет способ поведения обучающего агента в данный момент времени. Грубо говоря, политика - это сопоставление воспринимаемых состояний окружающей среды с действиями, которые должны быть предприняты в этих государствах.

Но все еще не до конца понял. Что именно представляет собой политика в обучении с подкреплением?

Если вы находитесь в состоянии 1, вы (при условии жадной стратегии) выберете действие 1. Если вы находитесь в состоянии 2, вы выберете действие 2.

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Если вы находитесь в состоянии 1, вы (при условии жадной стратегии) ​​выберете действие 1. Если вы находитесь в состоянии 2, вы выберете действие 2.

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Если вы находитесь в состоянии 1, вы (при условии жадной стратегии) выберете действие 1. Если вы находитесь в состоянии 2, вы выберете действие 2.