2015-08-30 1 views
0

Я создал поле Solr следующим образом:извлечения проанализированного опоясывающие из Solr дока (Lucene, Лука)

<analyzer type="index"> 
    <tokenizer class="solr.LowerCaseTokenizerFactory"/>    
    <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/> 
    <filter class="solr.ShingleFilterFactory" minShingleSize="3" maxShingleSize="5"/> 
    <filter class="solr.PatternReplaceFilterFactory" pattern=".*_.*" replacement=""/> 
</analyzer> 

Это создает гальку документы с ожидаемыми результатами. Я хочу получить все черепицы конкретного запроса фильтра, которые я не могу найти. Я пробовал использовать luke для получения индексов, но, давая мне всю черепицу не из запроса фильтра. Есть ли способ получить такие данные?

ответ

0

Ограждение от этого поля даст вам все жетоны вместе с подсчетами, сколько раз появляются токены. Этого может быть достаточно.

Если вы делаете это для тестирования отдельных входов, вы также можете просто попробовать его на экране анализа веб-интерфейса администратора.

+0

Я использую следующий запрос: http: // localhost: 8983/solr/shingleTest/select? Id: 3232843 & wt = json & indent = true & facet = true & facet.field = myText & facet.limit = 10000, но он дает мне всю черепицу в ядре. Я только хочу, чтобы черепица из этого конкретного документа хранилась. Есть ли способ достичь этого? –

+0

Границы отсчитываются от совпадений для запроса. Если ваш запрос соответствует только одному документу ..... –

 Смежные вопросы

  • Нет связанных вопросов^_^