2013-10-28 1 views
2

Существует проект для лаборатории. Требование сохранить лабораторные данные (необработанных данных и связанной с ними информации) для исследований в течение многих лет. Таким образом, данные должны сохраняться годами, но данные такие большие, каждый необработанных данных более 10 ГБ. Если мы храним необработанные данные в файле таблицы SQL Server и сохраняем соответствующую информацию в обычной таблице SQL Server, то после нескольких месяцев или лет размер базы данных настолько велик, что мы должны перенести некоторые данные истории из базы данных.Является ли таблица файлов SQL Server пригодной для хранения больших файлов (более 10 ГБ)?

Возможно, мы могли бы добавить файлы (на другом жестком диске) в файловую группу filestream для файла таблицы (хранить необработанные данные), но я считаю, что это не подходит для поддержки SQL Server. Мы должны поддерживать согласованность исходных данных и данных.

Фактически мы рассмотрели использование ленты для сохранения исходных данных истории. Мы хотим использовать жесткий диск для сохранения последних необработанных данных и использовать ленту для сохранения исходных данных истории. Когда мы перемещаем данные истории на ленту, мы записываем журнал перемещения в таблицу, чтобы мы могли знать, куда перемещаются данные истории, и как можно скорее забрать его.

Есть хороший совет для меня:

  • Как хранить исходные данные и связанную с ними информацию?
  • Подходит ли файл для сценария?
  • Есть ли еще одно хорошее решение для этого сценария?
+0

Я бы сказал, сохраните метаданные в базе данных и сам файл «где-то еще». Где это зависит от того, как, когда и как часто вы хотите его использовать. Я не должен сохранять файлы в базе данных, но вы сами пришли к этому ответу. – Alfons

+0

Одна деталь требования: у нас есть машина (Xradia MicroXCT) для сканирования образца (например, небольшие скалы), при обработке мы вводим некоторые параметры для системы управления MicroXCT. Из-за параметров важны результаты MicroXCT, поэтому мы должен сохранять параметры и результат MicroXCT (необработанные данные), размер которых превышает 10 ГБ. Исходные данные будут обрабатываться в следующие дни или месяцы или годы, поэтому мы должны хранить необработанные данные и параметры в течение длительного времени. – huoxudong125

+0

Являются ли сырые данные одним файлом или серией файлов, которые создают весь набор данных? –

ответ

1

Существует не простой ответ. Даже Microsoft не ответит вам простым ответом, см. Здесь: http://msdn.microsoft.com/en-us/library/hh403405.aspx

Я не могу ответить на файловые файлы. Просто помните, что вам нужно SQL 2012.

Основываясь на моем опыте (как DBA):
- магазин на файловой системе лучше для выступлений и стоимости: вы можете использовать другой тип хранения Исло, различные машины
- магазин на файловой системе является лучше для резервного копирования: вы можете дедуплицировать, управлять лучшим сжатием и так далее.

Настоящий недостаток, если вы храните в файловой системе, вы теряете транзакцию.

У меня был похожий сценарий с файлами до некоторого GB:
Я использовал таблицу корреляции, чтобы указать некоторые метаданные и где находится файл.