Кластер RabbitMQ не восстанавливает соединение после сбоя сети

У меня есть кластер RabbitMQ с двумя узлами в работе, и кластер ломается с этими сообщениями об ошибках:

= ОТЧЕТ ОБ ОШИБКАХ ==== 23 декабря 2011 года :: 04: 21: 34 ===
** Node rabbit @ rabbitmq02 не отвечает **
** Удаление (тайм-аут) соединения **

= ИНФОРМАЦИОННЫЙ ОТЧЕТ ==== 23 декабря 2011 года :: 04:21:35 ===
узел кролик @ rabbitmq02 потерял "кролик"

= ОТЧЕТ ОБ ОШИБКАХ ==== 23 декабря 2011 года :: 04: 21: 49 ===
Mnesia (rabbit @ rabbitmq01): ** ОШИБКА ** mnesia_event получил {inconsistent_database, running_partitioned_network, rabbit @ rabbitmq02}

Я попытался смоделировать проблему, разорвав соединение между двумя узлами с помощью «tcpkill», кластер отключился, и, что удивительно, два узла не пытаются восстановить соединение!

Когда кластер ломается, балансировщик нагрузки haproxy по-прежнему помечает оба узла как активные и отправляет запрос им обоим, хотя они не находятся в кластере.

Мои вопросы:

Если узлы настроены на работу в качестве кластера, когда я получаю сбой сети, почему они не пытаются повторно подключиться после?

Как я могу определить неисправный кластер и отключить один из узлов? У меня проблемы согласованности при работе с двумя узлами по отдельности.

Ответы на вопрос(3)

Ваш ответ на вопрос