Мне нужно найти довольно длинную строку для кодов CPV (обычных закупок).Наиболее эффективный способ определения подстроки в строке в python?
на данный момент я делаю это с простым циклом и str.find()
проблема, если код КНДА был перечислен в несколько ином формате, этот алгоритм не найдешь Это.
Каков наиболее эффективный способ поиска всех различных итераций кода внутри строки? Это просто случай переформатирования каждого из 10 000 кодов CPV и использования str.find() для каждого экземпляра?
Пример разного форматирования может быть следующим
30124120-1
301241201
30124120 - 1
30124120 1
30124120.1
т.д.
Спасибо :)
+1 для нормализации. Однако я рекомендую использовать префикс строки 'r' вместо' \\\ t'. –
@larsman: Благодарю вас, я изменил его на необработанную строку и переупорядочил список символов для более легкого понимания. –