Мне просто интересно, можем ли мы достичь некоторых возможностей РСУБД в lucene.Использование Lucene как реляционной базы данных
Пример: 1) У меня есть 10 000 проектных документов (pdf-файлов), которые необходимо проиндексировать с их содержимым, чтобы сделать их доступными для поиска. 2) Каждый документ относится к ОДНОМУ ПРОЕКТУ. Проект может содержать такие данные, как название проекта, номер, дата начала, дата окончания, местоположение, тип и т. Д.
Я должен искать в содержимом pdf-файлов для данного ключевого слова, но при отображении результатов я хочу отображать метаданные проекта, как указано в пункте (2).
Моя идея - связать поле под названием projectId с каждым файлом PDF при индексировании. Как только мы получим это, мы снова начнем поиск поиска для получения метаданных проекта.
Таким образом, мы могли бы избежать дублирования данных. Кроме того, если мы хотим обновить метаданные проекта, мы закончим обновление только на одном месте. В противном случае, если мы сохраним эти метаданные со всеми индексами pdf douce, мы закончим обновление всех документов, чего я не ищу.
сообщите пожалуйста.
Вы пытаетесь избежать репликации, чтобы сократить объем пространства, занимаемого дублирующимися данными? Или вы пытаетесь избежать логистики для синхронизации двух систем? –