Я пытаюсь выяснить, есть ли способ сделать нечеткие слияния строки в Pandas на основе рациона difflib SequenceMatcher. В принципе, у меня есть два dataframes, которые выглядят следующим образом:Использование отношения difflib SequenceMatcher для слияния в Pandas
df_a
company address merged
Apple PO Box 3435 1
df_b
company address
Apple Inc PO Box 343
И я хочу, чтобы объединить так:
df_c = pd.merge(df_a, df_b, how = 'left', on = (difflib.SequenceMatcher(None, df_a['company'], df_b['company']).ratio() > .6) and (difflib.SequenceMatcher(None, df_a['address'], df_b['address']).ratio() > .6)
Есть несколько сообщений, которые близки к тому, что я ищу, но никто из них не работает с тем, что я хочу делать. Любые предложения о том, как сделать это нечеткое слияние с использованием difflib?
может помочь: http://stackoverflow.com/questions/31689147/how-to-filter- а-dataframe-используя-частичные-матчи-из-другого-dataframe/31689606 # 31689606 – dermen