Мне нужна помощь от вас. Питонисты: я соскабливаю все URL-адреса, начиная с «details.php?». от this page и игнорируя все остальные URL-адреса.Очистить конкретные URL-адреса от страницы и преобразовать их в абсолютные URL-адреса
Затем мне нужно преобразовать каждый URL-адрес, который я только что очистил до абсолютного URL-адреса, поэтому я могу соскрести их один за другим. Абсолютные адреса начинаются с:? http://evenementen.uitslagen.nl/2013/marathonrotterdam/details.php ...
Я попытался с помощью re.findall
так:
html = scraperwiki.scrape(url)
if html is not None:
endofurl = re.findall("details.php?(.*?)>", html)
Это заставляет меня список, но потом я застреваю. Кто-нибудь может мне помочь?