Для кластера служебной ткани необходимо, чтобы виртуальные машины были распределены через FD и UD (мы используем набор доступности для принудительного распределения). Затем эта топология используется для выбора узлов избирателя, размещения реплик системных служб, а также экземпляров служб клиентов/реплик служб. Когда вы указываете Overprovision = true, в основном лазурные положения содержат больше виртуальных машин, чем то, что вы просите, а затем случайным образом удаляет лишние (после достижения запрошенного номера). Это приводит к неравномерному распределению виртуальных машин и, возможно, к очень плохо сконфигурированному кластеру.
Причина, по которой вы видите эти удаленные ненужные виртуальные машины, выглядит как плохие узлы, потому что эти узлы изначально присоединились к кластеру, а затем были удалены (поэтому ткань службы все еще думает, что они в конечном итоге вернутся), мы, безусловно, можем сделать обновление для исправления этой проблемы, но вы не можете исправить неравномерное распределение узлов.
So - Всегда устанавливайте Overprovision = False в своих развертываниях VMSS.
Это должно быть подтверждено как часть проверки шаблона, в чем смысл развертывания потенциально разбитых SF-кластеров? –
Открыта проблема для этого https://github.com/Azure/service-fabric-issues/issues/145 –