O que pode causar alta variabilidade do tempo não rastreado nas solicitações do App Engine?

Acabei de executar um teste de carga no meu aplicativo. Notei uma variabilidade muito grande na latência para dois pedidos idênticos: 3 s vs. 30 s. Quando descobri os traços, encontrei o seguinte:

|                      | Traced (ms) | Untraced (ms) |
|----------------------+-------------+---------------|
| High-latency Request |         193 |         29948 |
| Low-latency Request  |         305 |          2934 |

Aqui estão as capturas de tela para os traços:

Baixa latência geral

Alta latência geral

Não consigo entender uma diferença de 10 para 1 no desempenho do tempo de execução.

Só vejo esses pedidos de alta latência sob carga. Alguma coisa no meu código poderia explicar essa variabilidade (assumindo que o mesmo caminho através do código foi seguido para ambas as solicitações)?

questionAnswers(2)

yourAnswerToTheQuestion