Я вижу определение типа поля Solr в Solr synonym setting for two Chinese characters 台,臺Solr Определение типа файла без тега Analyzer в schema.xml?
<fieldType name="text_zh" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
</analyzer>
<analyzer class="jeasy.analysis.MMAnalyzer" />
</fieldType>
Я смущен о двух местах:
- MMAnalyzer не является в какой-либо анализатор теге, что это значит?
- StandardTokenizerFactory и MMAnalyzer оба будут токенизировать текст, первый делает 1 грамм, где последний действительно выполняет поиск по словарю. Кто на первом месте и кто последний? Разве они не конфликтуют друг с другом? Каким будет конечный результат?
Спасибо! Я попробую! –