równoważenie obciążenia silnika aplikacji Google

Mam płatną aplikację w silniku aplikacji Google. Jak wszyscy wiecie, Google będzie pobierać opłaty za godziny wystąpienia.

Jedyne, czego nie byłem w stanie zrozumieć, to jaka jest logika, która powoduje, że Google ogrzeje inną instancję lub jak zdecyduje, jak załadować równoważenie ruchu między tymi instancjami.

Jak widać zzrzut ekranu ekranu instancji aplikacji (przepraszam za link, jestem nowy w stackoverflow i nie mogłem opublikować rzeczywistego obrazu), aby mieć pewność, że moi użytkownicy nie będą cierpieć z powodu długiego żądania ładowania, mam jedną instancję rezydent przez cały czas.

Zabawne jest to, że wydaje się, że żaden ruch nie dociera do instancji rezydenta, cały ruch faktycznie trafia do jednej z dynamicznych instancji. Co więcej, załóżmy, że zgodnie z ich algorytmem równoważenia obciążenia instancja dynamiczna jest przytłoczona, zamiast kierować ruch do instancji rezydentnej, rozgrzewali inną instancję dynamiczną, która wydaje się nie uzyskiwać tak dużego ruchu.

Gdybym nie płacił za potrójne godziny wystąpienia, nie dbałbym o to. Niestety muszę zapłacić za te godziny :)

Będę wdzięczny, jeśli ktoś będzie mógł podzielić się trochę więcej światła na następujące tematy:
1. Jak działa równoważenie obciążenia GAE?
2. Co mogę zrobić, aby uzyskać lepszą dystrybucję ruchu w moich instancjach (a tym samym zmniejszyć liczbę dynamicznych instancji w danym momencie)

Dzięki za pomoc!

questionAnswers(1)

yourAnswerToTheQuestion