2012-01-25 1 views
3

Как получить меру подобия документа с помощью Whoosh?Сравнение документов/сходство с использованием библиотеки поиска Whoosh Python

Я хочу создать «связанную» функцию, которая ранжирует другие ранее проиндексированные документы, которые имеют высокое сходство с документом.

Должен ли я вводить документ в виде длинной строки запроса? Я могу добавить документ в индекс и извлечь из него результат сходства?

Благодаря

ответ

1

свист класса поисковое имеет метод 'more_like()'.

Позволяет сравнивать и индексировать документ с другими проиндексированными документами и возвращает список документов, аналогичных данному документу.

И class whoosh.searching.Hit может дать оценку и счет.