Есть ли вероятность использования повышения полезной нагрузки, как описано here с FuzzyQuery? Или, может быть, можно предложить наилучшую стратегию для реализации гибридного поиска Fuzzy/Payload.Использование повышения полезной нагрузки с помощью FuzzyQuery в Lucene-4.x
В настоящее время у меня есть документы в индексе, в котором определенные части имеют более высокие приоритеты соответствия, используя технику, описанную в статье. Все идет хорошо, пока на сцену не выйдут нечеткие запросы.
Прямо сейчас я планирую как-то взломать код Lucene, чтобы иметь возможность корректировать термины с коэффициентом полезной нагрузки, например. в MultiTermQuery.TopTermsScoringBooleanQueryRewrite.addClause()
. Однако я не уверен, что это лучший способ решить проблему.
Просьба предложить.
Возможно, a very similar question было предложено некоторое время назад, но не удовлетворительное решение.
Ну, термин фильтры pertially решить эту проблему, но только тогда, когда мы можем выполнить один-к-одному преобразования. Когда нам нужно расширить, например, звездочка, простые фильтры без поиска в реальном индексе, подобном приведенному выше, приведут к экспоненциальному увеличению вариантов. Таким образом, мы должны повторно реализовать поиск индекса, чтобы имитировать фактическое поведение FuzzyQuery. – user3159253
Я согласен с вами. Это простое решение, которое может помочь только в простых случаях. –
К сожалению, мой случай не простой :) – user3159253