В difflib.get_close_matches(word, possibilities[, n][, cutoff])
, что использовать cutoff
здесь. Как это влияет на совпадение слов?В чем смысл аргумента cutoff в примере difflib.get_close_matches в python?
-1
A
ответ
0
Необязательный аргумент
cutoff
(по умолчанию0.6
) находится в диапазоне[0, 1]
float
. Возможности, которые не набирают, по крайней мере, то, что похоже на слово, игнорируются.
Попытка пример из документации:
In [11]: import difflib
In [12]: difflib.get_close_matches('appel', ['ape', 'apple', 'peach', 'puppy'])
Out[12]: ['apple', 'ape']
In [13]: difflib.get_close_matches('appel', ['ape', 'apple', 'peach', 'puppy'], cutoff=0.1)
Out[13]: ['apple', 'ape', 'puppy']
In [14]: difflib.get_close_matches('appel', ['ape', 'apple', 'peach', 'puppy'], cutoff=0.9)
Out[14]: []
Подробная информация о алгоритма отмечается в статье "Pattern Matching: The Gestalt Approach".
что такое отсечка? Как его найти? Связано ли это с расстоянием редактирования? –
Прочитайте документацию по адресу https://docs.python.org/3.4/library/difflib.html –
Я прочитал этот документ. В нем говорится, что опциональный параметр cutoff (по умолчанию 0.6) является float в диапазоне [0, 1]. Что это значит? –