У меня вопрос-опрос Solr, используя следующий тип поля:SnowballPorterFilterFactory и Wildcard в Solr параметры
<fieldType name="text_ci" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>
<filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt"/>
</analyzer>
</fieldType>
Как вы можете видеть, что это относится к «SnowballPorterFilterFactory» при индексировании и запросах. Если индекс я что-то вроде
вещи мыши и весело
Это получить индексируется как:
Как вы можете видеть слово «мышь» превращается в «Mous» «SnowballPorterFilterFactory». Это то, что мы хотим. Однако, когда мы ищем
Mouse *
Это, кажется, не применять «SnowballPorterFilterFactory» таким же образом. Я думаю, из-за * в конце.
Мой вопрос .. Есть ли способ, чтобы сделать «SnowballPorterFilterFactory» знают о подстановочных знаках? Так что, когда я запрашиваю для
Mouse *
я не получаю 0 результатов.
Интересно, если я запросить
* нами огромное
Запись действительно возвращается.
Или может кто-то предложить лучший способ запроса/индексации этого типа поля?
Благодаря Dave
Спасибо ... Это отвечает на мой вопрос о том, почему он не применяет фильтры. Мне нравится идея поля для копирования .. спасибо – CraftyFella