2013-11-13 2 views
0

Сегодня у нас возникла проблема с Azure VM, где одна виртуальная машина в состоянии доступности из 2 просто перестала отвечать. Через несколько минут мы заметили, что машина была выключена, а другая виртуальная машина в комплекте не была включена (это должно быть нормально, поскольку это не переход на другой ресурс). Мы посмотрим на мониторинг виртуальной машины и не было ни одного журнала, в котором говорилось бы, что было время простоя. Единственное, что мы нашли, это 2 странных журнала в Службах управления - Журналы операций.Непринужденное завершение работы Azure VM при AutoScaling

  • 11/12/2013 10:12:02 PM AutoscaleAction Преемник VirtualMachinesAvailabilitySet: хуг Autoscale
  • 11/12/2013 9:36:56 PM AutoscaleAction Преемник VirtualMachinesAvailabilitySet: хуг AutoScale

В первые из них был с следующими деталями:

Описания: автомасштаб двигатель пытается масштабировать ресурс «XYZ» от 0 экземпляров считать до 1 экземпляров кола.

LastScaleActionTime: 20131106T173020Z

NewInstancesCount: 1

OldInstancesCount: 0

Второй:

автомасштаба двигатель пытается масштабировать ресурс 'XYZ' от 2 экземпляров подсчет до 1 экземпляра.

LastScaleActionTime: 20131112T203656Z

NewInstancesCount: 1

OldInstancesCount: 2

Кто-нибудь знает, что может случиться было?

UPDATE

Azure Поддержка предоставила мне обратную связь и они объяснили, что машины снизились из-за размещение обновлений.

С уважением

ответ

0

Обе мои машины были отключены из-за обновления хоста и AutoScaling, установленного от 1 до 2 машин на основе использования ЦП. Поэтому я обнаружил, что AutoScaling не будет включать вторую машину при выполнении обновления хоста (что может быть очень полезно и сделать мои приложения в сети).

Я думаю, что объяснит проблему 0 из 1 экземпляра, поэтому не используйте AutoScaling с вышеуказанной настройкой, чтобы получить HA.

С уважением

1

Всякий раз, когда вы используете автомасштаба установить диапазон экземпляра, который говорит Azure минимальное и максимальное количество ВМ вы хотите работать в данный момент времени. В этом случае, похоже, вы установили минимум равным 1. Это объясняет, почему, когда оба виртуальных машины были остановлены, он включил один из них.

Кроме того, шкала от 2 до 1 была вероятной, потому что на вашей виртуальной машине была небольшая нагрузка (при условии, что вы масштабируете CPU). Если средний процессор остается ниже установленного вами целевого объекта (по умолчанию 60%), он будет уменьшаться до минимального значения (в данном случае 1).

+0

Да, это так, но это все еще не объясняет, почему все мои машины были опущены. – khorvat