У меня есть 2 запросы:Сколько результатов со значением "Levenshtein Расстояние на упрощенном китайском языке?
query1:你好世界
query2:你好
Когда я запускаю этот код с помощью библиотеки Python Левенштейн:
from Levenshtein import distance, hamming, median
lev_edit_dist = distance(query1,query2)
print lev_edit_dist
я получаю выход 12. Теперь вопрос, как значение 12, полученные ?
Потому что с точки зрения разницы ударов, Theres определенно больше, чем 12.
вы используете python2 или 3? – Fabricator
Я использую python 2.7 – jxn
Для китайских иероглифов было бы действительно целесообразно перейти на Python 3. Всевозможные проблемы с прилипанием re. Символы Юникода были сглажены. – Karpov