Мы создаем индексы lucene из данных, хранящихся в хранилище событий, в виде потока событий. Эти индексы используются для обеспечения эффективных возможностей подкачки/сортировки/поиска нашими данными.Дублирование всех данных в индексе Lucene
Бывает, что мы должны дублировать все данные в индексах, чтобы выполнить наши требования. Что является концептуально лучшим способом запроса данных в этой ситуации?
Я вижу 2 варианта:
- запрос все данные для построения представлений модели непосредственно из индекса
- запроса только список идентификаторов из индекса и использовать эти идентификаторы для запроса данных из хранилища событий
Мы также обеспокоены масштабируемостью и отказоустойчивостью, поэтому я тоже должен думать об этом. Какие-либо предложения?