1

Я хотел бы хранить данные JSON в столбце и проанализировать его методом поиска DSE как документа, а не как текстовое поле.Как анализировать поля JSON в Datastax (DSE) Поиск

Я не могу насиловать JSON документы в таблицу, потому что они не следуют общей схеме (или любого разумного размера набора схемы)

То, что я в настоящее время является рабочим подстановочные поиск по большой текстовое поле, которое выполняет плохо и не позволяет более сложные запросы.

Я прочитал, что SOLR supports nested documents, но документации недостаточно для применения к DSE. Там, кажется, no SOLR field type for nested docs, и я понятия не имею, как применять ограничения на имена объектов, как _childDocuments_ как видно here

Можно ли иметь DSE поиск рукояток полей/столбцов в виде отдельных или вложенных документов, и если да, то как настроить и использовать его?

Спасибо

+0

Вы изучали UDT? Здесь есть действительно хорошая запись Datastax. http://www.datastax.com/dev/blog/tuple-and-udt-support-in-dse-search – mando222

+0

IIUC, определяющий UDT, по-прежнему требует соответствия схеме, которой у меня, к сожалению, нет. Многие имена/ключи объектов в документах, с которыми я работаю, - это просто хеши, которые я не могу предвидеть. Тем не менее, UDT могут идти в правильном направлении для подмножества документов с более последовательной структурой, поэтому спасибо за подсказку. – kostja

+0

@ mando222, чтобы перефразировать ответ в терминах вопроса. Нет, индексирование документа JSON, хранящегося в записи в виде вложенного/отдельного документа, невозможно с выпуском DSE 5. Верный? – kostja

ответ

2

Кажется мне, что если вы не можете использовать UDT, другой вариант поля трансформаторов. (ссылка ниже)

Чтобы ответить на вопрос о вопросе. Индексирование документа JSON, хранящегося в записи как вложенного/отдельного документа, вполне возможно. Основная проблема здесь заключается в том, что данные, похоже, не имеют никакого времени или причины для формата. Это затрудняет обработку схемы, которую вы обычно используете в структуре JSON. Если мое понимание правильное, на самом деле нет такой структуры для работы здесь.

http://www.datastax.com/dev/blog/dse-field-transformers

+0

Спасибо, mando222, это еще ближе к тому, что я, к сожалению, также гораздо более активно. Документы имеют общие статические элементы, и у них также есть динамические элементы с общими именами, поэтому я не могу зафиксировать схему. К сожалению, я был испорчен elasticsearch, который с радостью индексирует все, что вы бросаете на него :) – kostja

+0

Существует открытый источник elasticsearch для cassandra. Я не использовал его, но это может сделать трюк. https://github.com/vroyer/elassandra – mando222

+0

Elassandra выглядит хорошо, не знал, что он существует. Спасибо за указатель, mando222 – kostja