Servidor wsgi concurrente sin bloqueo

Estoy tratando de poder responder a las solicitudes web entrantes simultáneamente, mientras que el procesamiento de una solicitud incluye una llamada de E / S bastante larga. Voy a usar gevent, ya que se supone que es "sin bloqueo"

El problema que encontré es que las solicitudes se procesan secuencialmente a pesar de que tengo muchos hilos gevent. Por alguna razón, las solicitudes son atendidas por un solo hilo verde.

Tengo nginx (con la configuración predeterminada que no es relevante aquí, creo), también tengo uwsgi y una aplicación wsgi simple que emula la llamada de bloqueo de IO como gevent.sleep (). Aquí están:

uwsgi.ini

[uwsgi]
chdir = /srv/website
home = /srv/website/env
module = wsgi:app
socket = /tmp/uwsgi_mead.sock
#daemonize = /data/work/zx900/mob-effect.mead/logs/uwsgi.log
processes = 1
gevent = 100
gevent-monkey-patch

wsgi.py

import gevent
import time
from flask import Flask

app = Flask(__name__)

@app.route("/")
def hello():
    t0 = time.time()
    gevent.sleep(10.0)
    t1 = time.time()
    return "{1} - {0} = {2}".format(t0, t1, t1 - t0)

luego, simultáneamente (casi) abro dos pestañas en mi navegador, y esto es lo que obtengo como resultado:

1392297388.98 - 1392297378.98 = 10.0021491051 
# first tab, processing finished at 1392297378.98

1392297398.99 - 1392297388.99 = 10.0081849098 
# second tab, processing started at 1392297398.99

Como puede ver, la primera llamada bloqueó la ejecución de la vista. ¿Qué hice mal?