При попытке простого выражения fuzzywuzzy с иностранными символами, я получаю ошибочные результаты, используя метод process.extractOne (я пробовал и без и-): >>> choices= [u"הלכות חנוכה",u"הלכות פורים
У меня есть два кадра данных, каждый из которых имеет различное количество строк. Ниже пара строк из каждого набора данных df1 =
Company City State ZIP
FREDDIE LEES AMERICAN GOURME
У меня есть 2 списка более миллиона имен с немного отличающимися соглашениями об именах. Цель здесь - сопоставить те записи, которые схожи, с логикой 95% -ной уверенности. Я понял, что есть библиотеки