Я пытаюсь использовать NGramFilterFactory в Solr (используя Sunspot in Rails), чтобы найти похожие заголовки. Мне удалось добавить новое поле в мою SOLR schema.xml как следующим образом:Поиск подобия с использованием Solr's NGramFilterFactory
<fieldType name="text_ngrm" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="4"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
Как я использую sunpsot в приложении рельсов и поэтому добавил новое поле через динамическое поле солнечного пятна. Все это сработало, и теперь я могу искать свою модель, используя NGramFilterFactory. Я не уверен в том, как настроить solr для поиска похожих заголовков. Вот мои конкретные вопросы:
- Имеет ли смысл использовать парсерный анализатор запросов, когда я пытаюсь запросить похожие заголовки?
- Как может параметр (Minimum 'Should' Match) помочь мне найти похожие заголовки?
- Основываясь на том, что именно я выбрал бы ngram min. и макс. размеры?
Благодарим за любую отзыв.