UWSGI matando trabalhadores rápido demais
Encontrei um bug no meu aplicativo da web que estava funcionando há mais de um ano e, quando mudei para o UWSGI em uma nova instância para acelerar um pouco as coisas, encontrei isso.
Meu aplicativo possui a janela modal "adição rápida", que permite ao usuário adicionar um novo cliente ao banco de dados e ir imediatamente ao carrinho de compras desse usuário. Então, o módulo faz umaPOST
pedido para/customers/quick_create/
, que faz o redirecionamento para/cart/10000
, Onde10000
é o ID do cliente. Então a diversão começa.
Como há uma verificação sobre isso/cart
para verificar se há um cliente com esse ID ou não, notei que a verificação é ativada e, quando essa solicitação é feita, o usuário é redirecionado para o link de fallback, para o carrinho real. Este é o código que executa a verificação:
q = Customer.query.filter_by(id=cust).first()
if q is None:
return redirect('/customers/')
A verificação está lá porque alguém pode chegar a esse estágio, não apenas através desse modal. E, às vezes, o usuário acessa o URL de fallback, às vezes, para o/cart
. Notodos os casos, o cliente é realmente criado, posso ir mais tarde e vê-lo no banco de dados. Por algum motivo, essa consulta SQL não encontra um cliente com esse ID.
Eu verifiquei os logs USGI e este é um pequeno trecho:
/usr/local/lib/python2.7/dist-packages/sqlalchemy/engine/default.py:324: Warning: Data truncated for column 'refill_date' at row 1
cursor.execute(statement, parameters)
[pid: 5197|app: 0|req: 1/1] 123.123.123.123 () {54 vars in 1285 bytes} [Tue Feb 3 14:34:59 2015] POST /customers/quick_create/ => generated 237 bytes in 43 msecs (HTTP/1.1 302) 4 headers in 421 bytes (2 switches on core 0)
Tue Feb 3 14:34:59 2015 - ...The work of process 5197 is done. Seeya!
[pid: 5200|app: 0|req: 1/2] 123.123.123.123 () {48 vars in 1118 bytes} [Tue Feb 3 14:35:00 2015] GET /cart/16198/ => generated 229 bytes in 42 msecs (HTTP/1.1 302) 4 headers in 417 bytes (1 switches on core 0)
Tue Feb 3 14:35:00 2015 - ...The work of process 5200 is done. Seeya!
Tue Feb 3 14:35:00 2015 - worker 1 killed successfully (pid: 5197)
Tue Feb 3 14:35:00 2015 - Respawned uWSGI worker 1 (new pid: 5218)
Tue Feb 3 14:35:00 2015 - worker 4 killed successfully (pid: 5200)
Tue Feb 3 14:35:00 2015 - Respawned uWSGI worker 4 (new pid: 5219)
Tue Feb 3 14:35:00 2015 - mapping worker 4 to CPUs: 0
Tue Feb 3 14:35:00 2015 - mapping worker 1 to CPUs: 0
Tue Feb 3 14:35:03 2015 - WSGI app 0 (mountpoint='') ready in 3 seconds on interpreter 0x1dd1630 pid: 5219 (default app)
Tue Feb 3 14:35:03 2015 - mounting uwsgi on /
Tue Feb 3 14:35:03 2015 - WSGI app 0 (mountpoint='') ready in 3 seconds on interpreter 0x1dd1630 pid: 5218 (default app)
Tue Feb 3 14:35:03 2015 - mounting uwsgi on /
[pid: 5199|app: 0|req: 1/3] 123.123.123.123 () {48 vars in 1110 bytes} [Tue Feb 3 14:35:00 2015] GET /customers/ => generated 3704543 bytes in 3402 msecs (HTTP/1.1 200) 3 headers in 370 bytes (18 switches on core 0)
Tue Feb 3 14:35:03 2015 - ...The work of process 5199 is done. Seeya!
Tue Feb 3 14:35:04 2015 - worker 3 killed successfully (pid: 5199)
Tue Feb 3 14:35:04 2015 - Respawned uWSGI worker 3 (new pid: 5226)
Tue Feb 3 14:35:04 2015 - mapping worker 3 to CPUs: 0
Tue Feb 3 14:35:05 2015 - WSGI app 0 (mountpoint='') ready in 1 seconds on interpreter 0x1dd1630 pid: 5226 (default app)
Tue Feb 3 14:35:05 2015 - mounting uwsgi on /
Esta é minha configuração UWSGI:
<uwsgi>
<plugin>python</plugin>
<socket>/run/uwsgi/app/example.com/example.com.socket</socket>
<pythonpath>/srv/www/example.com/application/</pythonpath>
<app mountpoint="/">
<script>uwsgi</script>
</app>
<master/>
<callable>app</callable>
<module>app</module>
<processes>4</processes>
<harakiri>60</harakiri>
<reload-mercy>8</reload-mercy>
<cpu-affinity>1</cpu-affinity>
<stats>/tmp/stats.socket</stats>
<max-requests>2000</max-requests>
<limit-as>512</limit-as>
<reload-on-as>256</reload-on-as>
<reload-on-rss>192</reload-on-rss>
<no-orphans/>
<vacuum/>
<lazy-apps/>
</uwsgi>
Realmente me parece estranho que o UWSGI mate esse trabalhador logo após a solicitação. Quando há uma solicitação para alguns arquivos estáticos, há novos PIDs para cada solicitação.
Isso não está acontecendo no mod_wsgi com a instância do Apache. A CPU aumenta para 100% de tempos em tempos, mas a carga média é boa,0.25, 0.22, 0.15
no momento da escrita, e o uso da RAM é de cerca de 300 em 900 MB.
Alguém pode me indicar uma direção certa? obrigado