Я знаю, что с помощью urllib вы можете проанализировать строку и проверить, является ли она действительным URL-адресом. Но как можно было бы проверить, содержит ли предложение в нем URL-адрес, а затем извлекает этот URL-адрес. Я видел некоторые огромные регулярные выражения, но я бы предпочел не использовать то, что я действительно не могу понять.Python - Разбор строки для URL-адресов и их извлечение
Итак, у меня есть строка ввода, и мне нужно найти и извлечь все URL-адреса внутри этой строки.
Что такое чистый способ обойти это.
Если ваш источник входных данных - html или xml, не делайте этого, используйте вместо этого правильный парсер. – Daenyth
Не могли бы вы разместить типичный пример ввода? –
Согласование URL-адресов - довольно большая тема, с множеством правил ... вот почему все регулярное выражение, которое вы находите, являются большими и трудными для понимания. Попытайтесь проверить это регулярное выражение (разделенное на соответствие различным URL-частям): https://stackoverflow.com/questions/9760588/how-do-you-extract-a-url-from-a-string-using- python/31952097 # 31952097 –