Балансировка нагрузки движка приложения Google

У меня есть платное приложение на Google App Engine. Как вы все знаете, Google будет взимать плату за часы вашего экземпляра.

Единственное, чего я не смог понять, - это какая логика заставляет Google нагревать другой экземпляр или как они решают, как распределить нагрузку между этими экземплярами.

Как вы можете видеть изСкриншот экрана экземпляров appengine (извините за ссылку, я новичок в stackoverflow и не смог опубликовать реальное изображение), чтобы убедиться, что мои пользователи не пострадают от длительного запроса на загрузку, у меня есть один экземпляр резидент во все времена.

Самое смешное в этом то, что кажется, что ни один из трафика не попадает в резидентный экземпляр, весь трафик фактически идет в один из динамических экземпляров. Кроме того, давайте предположим, что в соответствии с их алгоритмом балансировки нагрузки этот динамический экземпляр перегружен, вместо того, чтобы направлять трафик к резидентному экземпляру, они подогревали другой динамический экземпляр, который, по-видимому, также не получает такого большого трафика.

Если бы я не платил за часы тройной инстанции, мне было бы все равно. К сожалению, мне нужно заплатить за эти часы :)

Буду признателен, если кто-нибудь еще расскажет о следующем:
1. Как работает балансировка нагрузки GAE?
2. Что я могу сделать, чтобы лучше распределить трафик в моих экземплярах (и тем самым уменьшить количество динамических экземпляров в данный момент времени)

Спасибо за помощь!

Ответы на вопрос(1)

Ваш ответ на вопрос