Resiliência Kafka - Coordenadora do Grupo
Pelo que entendi, um dos corretores é selecionado como coordenador do grupo, responsável pelo reequilíbrio do consumidor.
Discovered coordinator host:9092 (id: 2147483646 rack: null) for group good_group
Eu tenho 3 nós com fator de replicação de 3 e 3 partições. Tudo está ótimo e quando eu mato kafka em nós não coordenadores, o consumidor ainda está recebendo mensagens.
Mas quando eu mato esse nó específico com o coordenador, o reequilíbrio não está acontecendo e meu aplicativo consumidor de java não recebe nenhuma mensagem.
2018-05-29 16:34:22.668 INFO AbstractCoordinator:555 - Discovered coordinator host:9092 (id: 2147483646 rack: null) for group good_group.
2018-05-29 16:34:22.689 INFO AbstractCoordinator:600 - Marking the coordinator host:9092 (id: 2147483646 rack: null) dead for group good_group
2018-05-29 16:34:22.801 INFO AbstractCoordinator:555 - Discovered coordinator host:9092 (id: 2147483646 rack: null) for group good_group.
2018-05-29 16:34:22.832 INFO AbstractCoordinator:600 - Marking the coordinator host:9092 (id: 2147483646 rack: null) dead for group good_group
2018-05-29 16:34:22.933 INFO AbstractCoordinator:555 - Discovered coordinator host:9092 (id: 2147483646 rack: null) for group good_group.
2018-05-29 16:34:23.044 WARN ConsumerCoordinator:535 - Auto offset commit failed for group good_group: Offset commit failed with a retriable exception. You should retry committing offsets.
Estou fazendo algo errado e existe uma maneira de contornar isso?