Я работаю над производственным приложением с несколькими серверами рельсов позади nginx loadbalancer. Мы отслеживаем процессы sidekiq с monit, и это работает отлично - когда sidekiq proces умирает, monit начинает его обратно.Как вы отслеживаете процессы sidekiq?
Однако недавно столкнулась с ситуацией, когда один из этих процессов работал и был видимым для monit, но почему-то не был виден sidekiq. Это привело к многим неудачным работам, и нам потребовалось некоторое время, чтобы заметить, что мы пропускаем один процесс в веб-интерфейсе sidekiq, так как monit рассказывал нам, что все в порядке, и все процессы запущены. Проблема была решена простым перезапуском.
И это подводит меня к моему вопросу: как вы контролируете свои процессы sidekiq? Я знаю, что могу использовать что-то вроде rollbar, чтобы уведомлять меня о неудачах рабочих мест, но я хотел бы знать, есть ли способ контролировать количество процессов и предпочтительно отправлять почту, когда кто-то умирает. Какие-либо предложения?
Что-то, что бы ping sidekiq/stats
и проверить ответ.