2017-02-14 6 views
0

У меня есть следующие настройки:Возможно ли создать предупреждающее устройство для стоп-дисков, которое будет предупреждать, когда какие-либо K8-стручки не работают?

K8 Ingress --> K8 Service --> K8 Pods x n 
(GCP LB for SSL)  (NodePort)  (containing the application) 

Я могу настроить stackdriver HTTPS безотказной работы для уведомления о когда сайт вниз, но это будет оповещать только тогда, когда все п стручки из строя.

Возможно ли создать предупреждающее устройство в виде стоп-сигнала, которое будет предупреждать о том, что ни один из n программных приложений не работает?

ответ

0

Во-первых, вам следует подумать о том, чтобы установить правильное масштабирование на место, чтобы вы могли вообще избегать необходимости оповещения, когда n струй приложений опущены. Кроме того, лучше предупредить о том, какие симптомы испытывают ваши пользователи (повышенная латентность или ошибки), а не в базовой инфраструктуре. Так как это может быть хорошо, если n контейнеров временно приостановлено, пока запросы пользователя все равно будут обслуживаться. Если вы работаете в GKE, вы можете предупредить о времени работы контейнера. Из вашего вопроса я предполагаю, что это не так, поэтому вы можете либо: * Зарегистрировать собственные проверки работоспособности, создать метрику журналов и предупредить, когда она находится под определенным порогом. * Аналогичным образом создайте индивидуальную метрику безотказной работы и оповещение. Обратите внимание, что я бы не стал создавать настраиваемую метрику и использовать метрическое отсутствие в качестве условия политики предупреждения, поэтому я не указал это как вариант. HTH и спасибо за использование Stackdriver.

+0

Спасибо - дайте мне пояснить настройку: я запускаю на GKE, с развертыванием K8, чтобы позаботиться о масштабировании. Проблема, которая у меня была, заключалась в том, что в проверке работоспособности контейнера K8 наблюдалась скрытая ошибка, так что через некоторое время стручок не запустился. Это означало, что со временем (скажем, в течение нескольких дней) я потерял стручки, и они попадут в CrashLoopBackoff. Я бы только предупредил, когда все n не удалось. Я думаю, было бы полезно установить оповещение, если для развертывания K8 есть #доступный <#desired. – user2515975