2017-02-09 17 views
0

Я запускаю Solr 6.4.1 на машине с Windows 7 с Chrome для проверки URL-адресов запросов в настоящее время.Работа с основными моментами на Solr 6.4.1

Я установил и получил рабочий индекс для набора тестовых документов - небольшое количество веб-страниц, сохраненных в виде файлов Docx в папке. Я могу работать с базовыми запросами, и теперь я пытаюсь подчеркнуть работу.

Я никоим образом не модифицировал схему - просто проиндексировал папку в ядро, называемое тестом.

Следующий запрос и подчеркивает, как я ожидаю:

http://localhost:8983/solr/test/select?hl=on&hl.fl=meta_author&q=steven&wt=xml&fl=meta_author 

и возвращает

...<lst name="highlighting"> 
<lst name="C:\Users\steven\Documents\Indexing\Dungeon Arena Building.docx"> 
<arr name="meta_author"> 
<str><em>steven</em></str> 
</arr> 
</lst>... 

Однако если я изменяю поле попытаться выделить, где этот термин встречается в названии документа не работает таким образом.

http://localhost:8983/solr/test/select?hl=on&hl.fl=dc_title&q=gothic&wt=xml&fl=dc_title 

возвращает

...<lst name="highlighting"> 
<lst name="C:\Users\steven\Documents\Indexing\Basic Gothic Dungeon.docx"/> 
<lst name="C:\Users\steven\Documents\Indexing\Dungeon Arena Building.docx"/> 
</lst>... 

Результаты являются правильными, но не выделяет идентифицированные поля данных.

Существуют ли какие-либо правила вокруг доступных полей, которые могут быть выделены или мне нужно что-то изменить в схеме?

Для контекста я собираюсь передать все содержимое файла в индекс, чтобы затем я мог представить ответ в контексте окружающего текста для просмотра пользователями.

ответ

0

проверить, сохраняется ли поле для dc_title.

В вашей схеме ваше поле должно выглядеть так: (тип поля может быть другим, как вы определили, но установите сохраненный = истинный), после модификации, reindex doc и повторите поиск.

<field name="dc_title" type="text_general" indexed="true" stored="true"/> 
+0

Спасибо за совет. Я просмотрел файлы и нашел только управляемую схему (без расширения) в папке conf с большим предупреждением «Не редактировать». Игнорирование предупреждения и обновления с помощью предоставленных вами инструкций и повторной индексации по-прежнему возвращает те же результаты с блоком выделения, но не содержит фактических сведений о деталях для синтаксического анализа. Я предполагаю, что мне просто нужно создать schema.xml и добавить его в папку, скопировав содержимое управляемой схемы, но можете ли вы подтвердить это? – user3644997

+0

В дополнение к этому я попытался добавить в клон управляемой схемы как schema.xml и внести изменения в содержимое, как указано, но это не показало никакой разницы в подсветке. Не знаю, где я здесь. – user3644997