Я использую python и mysql. Вот мой кодУдалите почти повторяющуюся строку из списка строк, используя Difflib
cur.execute("SELECT distinct product_type FROM cloth_table")
Product_type_list = cur.fetchall()
Теперь Product_type_list является список строк, описывающих product_type как этого
product_type_list =['T_shirts', 'T_shirt', 'T-shirt', 'Jeans', 'Jean', 'Formal Shirt' 'Shirt']
Здесь в product_type_list есть запись 3 дубликата для футболки и 2 для каждого джинсы и рубашки ,
Теперь я хочу, чтобы мой Product_type_list быть как этот
Product_type_list=['T_shirt' , 'Jeans', 'Shirt']
Я думаю, что мы можем использовать quickratio Difflib.Sequencematcher в. Но как это сделать
Спасибо за ваш ответ, но у меня нет знаний в логике соответствия Fts. можете ли вы предоставить мне некоторые ссылки, где я могу получить знания. –
Я, как уже говорилось, работал над этим, как задачи на SQL Server. Найдите эту ссылку, которая может дать некоторые ранга FTS и soundex. http://msdn.microsoft.com/en-us/library/cc879245.aspx, http://msdn.microsoft.com/en-us/library/ms187384.aspx –