Я использую lucene 4.10.4.Нечеткая сложность поиска в lucene
Может ли кто-нибудь объяснить мне, как работает нечеткий поиск? Сколько увеличивается время поиска по сравнению с обычным поиском?
Я использую lucene 4.10.4.Нечеткая сложность поиска в lucene
Может ли кто-нибудь объяснить мне, как работает нечеткий поиск? Сколько увеличивается время поиска по сравнению с обычным поиском?
Начиная с Lucene 4, нечеткий поиск был реализован более эффективно, путем использования Fast string correction with Levenshtein automata paper
Чтобы сделать очень длинную историю Короче этот документ показывает, как распознать множество всех слов V в индексе где расстояние Левенштейна между V и запросом не превышает расстояние d, что точно соответствует с нечетким поиском.
Конечно, он все равно будет медленнее, чем просто прямой поиск, который вы сделаете для конкретного термина, однако это не убийца с производительностью.