equilibrio de carga del motor de la aplicación de google

Tengo una aplicación de pago en el motor de Google Apps. Como todos ustedes saben, Google le cobrará por sus horas de instancia.

Lo único que no pude entender es cuál es la lógica que hace que Google caliente otra instancia, o cómo deciden cómo cargar el equilibrio del tráfico entre esas instancias.

Como se puede ver en elcaptura de pantalla de la pantalla de instancias de appengine (perdón por el enlace, soy nuevo en stackoverflow y no se me permitió publicar una imagen real), para garantizar que mis usuarios no sufran una solicitud de carga prolongada, tengo una instancia Residente en todo momento.

Lo curioso de esto es que parece que ninguno de los tráficos está llegando a la instancia residente, todo el tráfico va a una de las instancias dinámicas. Además, supongamos que, de acuerdo con su algoritmo de equilibrio de carga, esa instancia dinámica se ve superada, en lugar de dirigir el tráfico a la instancia residente, calentaron otra instancia dinámica que parece que tampoco recibe tanta cantidad de tráfico.

Si no estuviera pagando por el triple de horas, no me importaría. Desafortunadamente, necesito pagar estas horas :)

Apreciaré si alguien puede compartir algo más de luz con respecto a lo siguiente:
1. ¿Cómo funciona el balanceo de carga de GAE?
2. ¿Qué puedo hacer para obtener una mejor distribución del tráfico en mis instancias (y de ese modo reducir la cantidad de instancias dinámicas en un momento dado)

¡Gracias por la ayuda!

Respuestas a la pregunta(1)

Su respuesta a la pregunta