За исключением CouchDB и родных XML-баз данных (например, eXist), какие базы данных могут хранить и запрашивать не- и полуструктурированные данные?Базы данных, которые могут обрабатывать полуструктурированные данные?
Я получил много данных в разных форматах (XML, JSON, YAML, CSV, некоторые пользовательские форматы), с которыми мне нужно объединиться и работать, но разработка схемы в реляционной базе данных будет временем, потребляющих и трудных.
В основном, я рассматриваю решения с открытым исходным кодом. Кроме того, в какой-то момент я хотел бы сделать эти данные доступными как-то.
Я понимаю, что некоторые из этих данных будут преобразованы в общий формат для работы. На фронте XML есть несколько хороших решений: eXist-db и BerkeleyDB-XML, похоже, имеют хорошую поддержку XQuery.
Кроме того, в то время как еще довольно молодой, CouchDB выглядит многообещающим с его простым форматом документов.
Другие проспекты, на которые я смотрел, - это OODBMS, такие как ZODB и db4o; напишите несколько простых скриптов синтаксического анализа, а затем просто сохраните результирующий объект записи «как есть». Проблема в том, что они запрашивают их впоследствии; У OODBMSs, похоже, нет хорошей истории движков запросов.
То, что я не увлекаюсь, - это решения «blobs-in-rel-db». Кажется, что это взломать и не позволяет эволюционировать данные, индексировать FT и т. Д.
Есть ли другие решения, с которыми я не сталкивался?
Данные полуструктурированы, но структуры, как правило, не соответствуют никакому другому документу/файлу. – 2008-10-22 22:44:02