Я использую BeautifulSoup для извлечения изображений, которые хорошо работают для обычных страниц. Теперь я хочу, чтобы извлечь картину Chromebook с веб-страницы, как этотЗагрузка изображений с BeautifulSoup
https://twitter.com/banprada/statuses/829102430017187841
страница по-видимому, содержит ссылку на другую страницу с изображением. Вот мой код для загрузки изображения из указанной ссылки, но я получаю только изображение человека, разместившего ссылку.
import urllib.request
import os
from bs4 import BeautifulSoup
URL = "http://twitter.com/banprada/statuses/829102430017187841"
list_dir="D:\\"
default_dir = os.path.join(list_dir,"Pictures_neu")
opener = urllib.request.build_opener()
urllib.request.install_opener(opener)
soup = BeautifulSoup(urllib.request.urlopen(URL).read())
imgs = soup.findAll("img",{"alt":True, "src":True})
for img in imgs:
img_url = img["src"]
filename = os.path.join(default_dir, img_url.split("/")[-1])
img_data = opener.open(img_url)
f = open(filename,"wb")
f.write(img_data.read())
f.close()
Есть ли возможность загрузить изображение как-нибудь?
Большое спасибо и привет, Andi
страница имеет JS, которая не отображается, когда вы извлечения веб-страницы с URLLIB –
пытаются использовать JS рендерер LIB как dryscrape упоминается в [здесь] (HTTP: // stackoverflow.com/questions/8049520/web-scraping-javascript-page-with-python) –
Требуемое изображение находится внутри 'iframe', которого нет в исходном источнике страницы. Допустимо ли вам получить решение в 'Python' +' selenium'? – Andersson