Design de failover entre cores, failover em nível de DNS?

Estou interessado em estratégias de failover entre cores para aplicativos da Web, de modo que, se o site principal falhar, os usuários aterrem sem problemas no site de failover em outro colo.

O lado do aplicativo parece estar principalmente resolvido com uma configuração de banco de dados mestre-escravo entre colos e serviços projetados para recuperar e poder captar o fluxo intermediário. Estou tentando descobrir a estratégia para mover o tráfego do site principal para o site de failover. O failover de DNS, mesmo com TTLs baixos, parece ter umaum pouco de latência.

Quais estratégias você recomendaria para mover rapidamente o tráfego entre colos, supondo que os servidores na colo principal sejam inacessíveis?

Se você tiver outras experiências interessantes / palavras de sabedoria sobre o failover entre cores, eu adoraria ouvi-las também.