2013-03-04 6 views
0

Чтобы иметь большой набор данных с изображениями и видеороликами, я хотел бы использовать Apache Xindice. В WWW для Apache Xindece очень мало учебников и руководств. Как сохранить изображения и видеофайлы в Apache Xindice? Является ли Apache Xindice подходящим для создания большого набора данных? Есть ли какой-либо последний репозиторий, который может хранить большой набор данных в формате XML (не SQL-тип баз данных. Должен ли сохранять данные размера TB)? Могу ли я использовать MongoDB для хранения большого набора данных?Хранить видеофайлы и изображения в Apache Xindice в формате XML

+0

Также похоже, что Xindice мертв или никогда не выпускался http://attic.apache.org/projects/xindice.html – br3w5

+0

@ssbrewster MongoDB не хранит свои документы как JSON, то есть couchDB, вместо этого он использует BSON – Sammaye

+0

@Sammaye, да, вы абсолютно правы, я должен знать лучше! – br3w5

ответ

0

Я предлагаю хранить внешние документы (изображения/видео, файлы XML) в MongoDB, используя файловую систему GridFS. Коллекция GirdFS состоит из двух частей: коллекции кусков, где хранятся двоичные данные, и коллекции файлов, содержащих информацию о файлах, включая метаданные, определенные клиентом. Из FAQ:

В некоторых ситуациях, для хранения больших файлов может быть более эффективным в базы данных MongoDB, чем в файловой системе на системном уровне.

Если ваша файловая система ограничивает количество файлов в каталоге, вы можете использовать GridFS для хранения как можно большего количества файлов. Если вы хотите сохранить , ваши файлы и метаданные автоматически синхронизируются и развертываются по количеству систем и средств.

При использовании географически распределены реплики наборы MongoDB могут распространять файлы и их метаданные автоматически в ряде случаев mongod и , облегчает.

Если вы хотите получить доступ к информации из частей больших файлов без необходимости загружать файлы целиком в память, вы можете использовать GridFS вспомнить разделы файлов, не читая весь файл в память.

Для больших наборов данных, GridFS может быть оштукатурен (см. http://docs.mongodb.org/manual/core/sharded-cluster-internals/#sharding-gridfs-stores).

Для быстрой доставки данных GridFS существуют модули для ngnix (ngnix-gridfs) и Apache (mod_gridfs). См. Также http://nosql.mypopescu.com/post/28085493064/mongodb-gridfs-over-http-with-mod-gridfs для быстрого сравнения