2010-05-05 5 views
1

Эта проблема появилась сегодня, и я понятия не имею, что происходит. Пожалуйста, поделитесь идеями.Интересные вопросы, связанные с lighttpd на Amazon EC2

У меня есть 1 сервер EC2 DB (разделение файлов MYSQL + NFS + Memcached).

И у меня есть 3 веб-сервера EC2 (lighttpd), где будут установлены папки NFS на сервере БД.

Все идет гладко в течение нескольких месяцев, но внезапно возникает интересное явление.

За каждые 8 ​​минут до 10 минут файл PHP будет недоступен. Это будет продолжаться около 1 минуты, а затем вернуться в нормальное состояние. Обычные файлы, такие как .html-файл, не затрагиваются. Все серверы имеют одну и ту же проблему в одно и то же время.

Я провел целый день, чтобы проанализировать причину. Наконец, я выясняю, когда возникает проблема, файловый дескриптор lighttpd внезапно сильно увеличился.


Я использовал ls /proc/1234/fd | wc -l проверить количество fd.

Номер fd составляет около 250 в обычное время. Однако, когда проблема возникла, она будет поднята до 1500, а затем вернется к норме.

Звучит смешно, правда? Вы не знаете, что происходит?

======================== График ЦП одного из веб-серверов. alt text http://pencake.images.s3.amazonaws.com/4be1055884133.jpg

+0

Возможно ли, что это атака DOS? –

ответ

1

Мысли:

  • Посмотрите на dmesg выходе.
  • Число файловых дескрипторов, вскакивающих вверх, звучит для меня, как будто что-то блокирует, в том числе обработку соединений с lighttpd/PHP, которая накапливает неустранимое условие блокировки.
  • Когда вы говорите, что файл PHP недоступен, вы имеете в виду, что файл отсутствует? Или, может быть, скрипт PHP останавливается во время выполнения или? Что говорят файлы журнала lihttpd при вызовах этого скрипта PHP. Есть ли другие подсказки в lighttpd?
  • Каковы максимальные файловые дескрипторы для процесса/пользователя?
  • Время от времени у меня и у других было странное сетевое поведение на экземплярах EC2. Дайте нам более подробную информацию об этом. Возможно, настройте дополнительный мониторинг возможности подключения между вашими экземплярами. Подумайте о переносе вашего экземпляра проблемы на другой экземпляр в надежде на то, что проблема магически исчезнет. (Выстрел в темноте.)

И наконец ...

  • DOS атаки? Я сомневаюсь в этом - он будет отключен или нет. Это way слишком рано в процессе отладки для вас, чтобы вызывать злобу на кого-то часть elses.
+0

ну, проблема ушла автоматически. Я ничего не изменил. Может быть, это проблема EC2. –

+0

да, хорошо ...то это очень звучит как один из тех волшебных отскоков EC2 ... удачи! –