2016-08-30 3 views
6

Я использую последнюю версию сенсационного ядра 0.26.1, настроил сервер sensu на одной машине CentOS, настроил один клиент sensu на другой.Ошибка клиентской ошибки «Выполнение предыдущей проверки выполняется»

В одном сенсусе есть около 500 проверок, я вижу "previous check command execution in progress" в sensu-client.log, но каждая проверка фактически заканчивается очень быстро (большинство из них менее 0,1 секунды и интервал 60 секунд) , я могу подтвердите это, запустив его под sensu пользователем sudo su sensu -c "{run my check}".

Однако реальная ситуация, в uchiwa приборной панели, она показывает многие из моих проверок были запущены более чем на 1 минуту, кажется, клиент зепзи получил серьезно застрял/медленно, я попытался следующие подходы:

  1. Удалить несколько длительных проверок и перезапустить зепзи сервер/клиент
  2. Добавить timeout определения моих чеков, таймаут до 10, то в результате многих проверок «Исполнение истекло».
  3. Я пробовал только запустить 1, 10, 50 чеков, кажется, что все работает нормально, однако, как только количество проверок достигает определенного количества, возможно, 200-300, проблема возникла.

Ни один из вышеперечисленных работ не существует, есть ли способ отладки, какие проверки фактически блокируют? Или я могу настроить sensu, чтобы просто убить чек, когда он превысил определение timeout? Так что я не буду видеть это сообщение в журнале «предыдущее выполнение команды проверки в ходе»

я получил заблокированное этим и нужен помощь :)

ответ

1

Для отладки этого вы можете явно проверить Sensu-client.log , Вы можете настроить уровень протоколирования в файл по умолчанию для

смысла слова

к тому, что: ps aux | grep sensu покажет вам, что каждая проверка будет отображаться как отдельный процесс, и вы можете легко подтвердить вручную, если и какие проверки могут быть повесили трубку. Обычная проблема здесь в том, что в проверках есть недостатки, из-за которых они зависают, чем сам сенсу-клиент.

Я испытал это с некоторыми проверками.

Чтобы получить более подробную информацию о вашей проблеме, потребуется как минимум некоторый вывод журналов и команда ps [при возникновении проблемы].