Вопрос:Базы данные документов/Изображения Repository Дизайн Вопрос
Должен ли я написать мое приложение для прямого доступа к хранилищу базы данных изображения или записям промежуточной части для обработки запросов документов.
фон:
У меня есть визуализации пользовательских документов и приложения бизнес-процесс, который в настоящее время хранится около 15 миллионов документов/изображений документов (90% + одна страницы 4 группы размолвки, в PDF отдыха, Word и Excel документы). Репозиторий изображений является коммерческим, сторонним приложением, которое очень дорого и, откровенно говоря, слишком много накладных расходов. Мне просто нужна система для хранения и получения изображений документов.
Я рассматриваю возможность перемещения изображений непосредственно в базу данных SQL Server 2005. Индексирующая информация очень ограничена - в основном 2 поля индекса. Это система администрирования политики страхования жизни, поэтому я индексирую изображения с номером политики и уникальным идентификационным номером системы. Существуют и другие значения индекса, но они сохраняются и сохраняются отдельно от данных изображения. Эти значения индекса дают мне возможность поиска уникального значения id для индивидуального поиска изображений.
Сервер базы данных представляет собой двухъядерный ядро Windows 2003 с SAN-дисками, на которых размещаются файлы DB. Размер текущего репозитория изображения составляет около 650 ГБ. Я не проводил никаких тестов, чтобы увидеть, насколько большой будет конвертированная база данных. Я не спрашиваю о дизайне базы данных - я работаю с нашими администраторами баз данных по этому аспекту. Если это изменится, я вернусь :-)
Текущая система, которую нужно заменить, является, очевидно, промежуточным приложением, но это очень тяжелая система, распространяемая на трех серверах Windows. Если я пройду этот маршрут, это будет единая серверная система.
Мои главные проблемы - это скалистость и производительность - в значительной степени ориентированные на производительность. У меня около 100 пользователей, и рост использования, вероятно, будет медленным в течение следующих нескольких лет. Большинство пользователей в основном читают пользователей - они не добавляют изображения в систему очень часто. У нас есть отдел, который обрабатывает сканирование и иным образом добавляет изображения в репозиторий. У нас также есть несколько других приложений, которые получают документы (через ftp), и они автоматически вставляют их в репозиторий по мере их получения, либо получают полную информацию индекса, либо как «партии», которые просматривают и индексируют пользователи.
Большинство (90% +) документов/изображений очень малы, < 100K, возможно < 50K, поэтому я считаю, что хранение изображений в файле базы данных будет наиболее эффективным, а не получением SQL 2008 и использованием филе.
В настоящее время он работает на Acorde Optika (который был приобретен Stellent, а затем приобретен Oracle). Захват не является проблемой, так как мы купили инструментарий управления изображениями Kofax и создали собственное приложение для сканирования. – rjrapson 2009-01-04 14:08:00