2012-06-30 8 views
2

У меня есть экземпляр ec2 (сеть 10 ГБ, AMI: EC2 CentOS 5.5 GPU HVM AMI (драйвер 260.19.29) (ami-42a2532b)) с 20 объемами EBS, прикрепленными к raid-0. В результате простоя последней ночи AWS 9 из этих томов были отмечены как «нарушение, возможная несогласованность данных» и I/O отключено. Экземпляр теперь остановлен. Объемы ожидают «Включить ввод-вывод».EBS Raid-0: 9 из 20 Объемы EBS «нарушены». Что теперь?

Кроме того, небольшой том EBS, который не является частью массива рейдов и который имеет корневой раздел, также был нарушен.

AWS рекомендует включить I/O томов, которые были повреждены, а затем запустить fsck, но, конечно, это не относится к томам EBS, используемым в массиве RAID.

Что было бы самым безопасным способом, чтобы попытаться восстановить этот массив? Я понимаю, что могу потерять все это, и поэтому у нас есть планы на случай непредвиденных ситуаций (гораздо больше работы & время для восстановления), но я предпочел бы поставить все шансы на свою сторону и попытаться восстановить/восстановить массив. Итак, какая же самая безопасная последовательность действий?

Спасибо.

ответ

2

Хотел сообщить, что бы добавить и закрыть этот вопрос. По сути, все прошло хорошо, и у меня не было никакого искажения данных. FSCK работает чистым, а параллельная БД, использующая этот массив, началась просто отлично, и все хорошо.

Вот некоторые команды, которые помогли собрать некоторые данные, как я осторожно вошел в шахте поля:

  • mdadm --detail /dev/md0 >md0_detail Получит обзор массива рейда.
  • mdadm --examine /dev/sd[fghijklmnopqrstuvwxy] > examine_sd Изучите каждый компонент массива рейдов.
  • Проверьте правильность всех контрольных сумм.
  • mount -o noatime /dev/md0 /data Поскольку тесты на низком уровне выглядели хорошо, попытались установить устройство рейда.

Примечание:

  • Фактических фс используемых устройства ext4 (Журналируемый)
  • Это пошло хорошо, и пройдя через это, казалось, все было, где оно должно быть.

Дальнейшие действия:

  • umount /data Размонтируйте массив RAID перед выполнением FSCK.
  • fsck /dev/md0 Все получилось чистым, без проблем.
  • mount -o noatime /dev/md0 /data Наконец, установите устройство на работоспособность.
+0

Вы живая заставка !!, с этим я мог бы восстановить свой RAID5 –