В случае сбоя сети или сбоя узла большинство распределенных атомных широковещательных протоколов (например, Расширенная виртуальная синхронизация или Paxos) требуют запускаемых узлов, чтобы вести протоколирование сообщений до тех пор, пока разбитый или разделенный узел не присоединится к кластеру. Когда узел присоединяется к кластеру, повторение записанных сообщений достаточно для восстановления текущего состояния.Сохраняет ли сообщения в службе групповой связи или практические действия paxos?
Мой вопрос в том, что если секционированный/аварийный узел занимает очень много времени, чтобы снова присоединиться к кластеру, то в конечном итоге журналы будут переполняться. Это, по-видимому, очень практичный вопрос, но никто в своей статье не говорит об этом. Есть ли очевидное решение для этого, которого я не вижу? Или мое понимание неверно.
«... об этом никто в своей статье не говорит». Вы спрашиваете о конкретной бумаге? Или что никто никогда не пытается решить эту проблему? –
Я прочитал статью, в основном связанную с услугами групповой связи, и там я не нашел, что это было поднято. Например, большинство виртуальных документов Synbcrony от Ken Birman, Extended Virtual Synchhony, CoREL и т. Д. –