Sondeo largo (notificación de usuario) con una arquitectura RESTful

Estoy trabajando en una simple API RESTful (en NodeJs). Entiendo que estar tranquilo implica que la escala horizontal será mucho más fácil. Desafortunadamente, necesito alguna forma para que los clientes sean notificados de ciertos eventos casi al instante. Por esta razón, estaba pensando en hacer encuestas largas. La pregunta que tengo es cómo funciona esto con varios servidores. Por ejemplo, aquí hay un caso usado simplificado:

Both servers A and B are behind a common load balancer.
User Alice posts a message on Bob's wall (PUT request on server A).
If Bob is online, he should be notified instantly (long-polling on server B).

¿Cómo puede el servidor A enviar una notificación a Bob, o el servidor B saber que Bob debería ser notificado?

Respuestas a la pregunta(2)

Su respuesta a la pregunta