Этот вопрос довольно открытый: нет единого «лучшего способа». MarkLogic поддерживает полное онлайн-резервное копирование и архивирование журнала для непрерывного инкрементного резервного копирования. В документах по адресу http://docs.marklogic.com/guide/admin/backup_restore обсуждаются эти параметры.
Вместо полной ежедневной резервной копии вы можете рассмотреть полную архивацию в течение недели и архивирование журналов. Когда вы начинаете новую неделю, вы можете делать все, что захотите, с данными с предыдущей недели: сохранить их, удалить, переместить на более дешевое хранилище и т. Д.
Поскольку базы данных MarkLogic идут, 350-ГБ не так большой. Однако в этот момент вы должны были уже настроить несколько лесов: см. http://docs.marklogic.com/guide/cluster/scalability#id_96443 для рекомендаций. Предполагая, что у вас несколько ядер процессора, хранение содержимого в пропорциональном количестве лесов улучшит производительность всей системы. Это включает резервное копирование, поскольку несколько лесов будут работать параллельно, хотя, конечно, диск все еще может быть узким местом. Если хранилище является узким местом, желательно отделить ввод-вывод для леса и резервное копирование.
Если у вас несколько лесов - это новая идея, вы также можете быть заинтересованы в https://github.com/mblakele/task-rebalancer