2013-05-10 1 views
1

Я работаю в производственной среде, где ежедневно обрабатывается XML файлов. Размер нашей базы данных довольно большой. мы берем ежедневную резервную копию. Я узнал, что Marklogic добавляет изменения в предыдущую резервную копию для создания новой резервной копии.Рекомендации по резервному копированию базы данных

Я хотел подтвердить, что это лучший способ сохранить ежедневное резервное копирование или есть другой лучший способ сделать это. Также есть ли какой-то предел для процесса, за которым я следую. Размер моей базы данных составляет около 350 ГБ и увеличивается ежедневно. Поэтому я ищу более быстрое и простое решение.

ответ

3

Этот вопрос довольно открытый: нет единого «лучшего способа». MarkLogic поддерживает полное онлайн-резервное копирование и архивирование журнала для непрерывного инкрементного резервного копирования. В документах по адресу http://docs.marklogic.com/guide/admin/backup_restore обсуждаются эти параметры.

Вместо полной ежедневной резервной копии вы можете рассмотреть полную архивацию в течение недели и архивирование журналов. Когда вы начинаете новую неделю, вы можете делать все, что захотите, с данными с предыдущей недели: сохранить их, удалить, переместить на более дешевое хранилище и т. Д.

Поскольку базы данных MarkLogic идут, 350-ГБ не так большой. Однако в этот момент вы должны были уже настроить несколько лесов: см. http://docs.marklogic.com/guide/cluster/scalability#id_96443 для рекомендаций. Предполагая, что у вас несколько ядер процессора, хранение содержимого в пропорциональном количестве лесов улучшит производительность всей системы. Это включает резервное копирование, поскольку несколько лесов будут работать параллельно, хотя, конечно, диск все еще может быть узким местом. Если хранилище является узким местом, желательно отделить ввод-вывод для леса и резервное копирование.

Если у вас несколько лесов - это новая идея, вы также можете быть заинтересованы в https://github.com/mblakele/task-rebalancer