Мне нужно создать код для извлечения слова из одной царапины изображений. Я объясню, со страницы sitemap.xml мой код должен попробовать в каждой ссылке, присутствующей в этом xml-файле, найти каждую ссылку, если есть определенное слово, внутри ссылки изображения.Как создать список из файла sitemap.xml, чтобы извлечь url в python?
карта сайта является адидас = http://www.adidas.it/on/demandware.static/-/Sites-adidas-IT-Library/it_IT/v/sitemap/product/adidas-IT-it-it-product.xml
это код, который я создал для поиска изображение содержит слово «ZOOM»:
import requests
from bs4 import BeautifulSoup
html = requests.get(
'http://www.adidas.it/scarpe-superstar/C77124.html').text
bs = BeautifulSoup(html)
possible_links = bs.find_all('img')
for link in possible_links:
if link.has_attr('src'):
if link.has_key('src'):
if 'zoom' in link['src']:
print link['src']
но им искать Metod, чтобы очистить список в автоматическом
ThankYou так
я пытаюсь сделать это для есть список:
from bs4 import BeautifulSoup
import requests
url = "http://www.adidas.it/on/demandware.static/-/Sites-adidas-IT-Library/it_IT/v/sitemap/product/adidas-IT-it-it-product.xml"
r = requests.get(url)
data = r.text
soup = BeautifulSoup(data)
for url in soup.findAll("loc"):
print url.text
, но я не могу прикрепить запрос ..
я могу найти слово «Масштаб» в любой ссылке, присутствующей в sitemap.xml
ThankYou столько
И ваш вопрос ... –
обновите код, а не комментарий. –