Я хочу сканировать некоторые фотографии на сайте Redfin, но, похоже, что метод FindAll() не может найти все URL-адрес изображения, родительским классом которого является ImageCard.Beautifulsoup findall() не может найти все цели
Вот код:
from bs4 import BeautifulSoup
import urllib2
def make_soup(url):
headers = {'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
req = urllib2.Request(url, headers=headers)
thepage = urllib2.urlopen(req).read()
soupdata = BeautifulSoup(thepage, "html.parser")
return soupdata
soup = make_soup("https://www.redfin.com/CA/San-Diego/5747-Adobe-Falls-Rd-92120/unit-A/home/5437025")
imgcards = soup.findAll('div', {'class': 'ImageCard'})
for imgcard in imgcards:
img = imgcard.findAll('img')
print(img['src'])
I want to download all the images in this slide on the web page
Элементы дерева: elements tree of webpage
Я могу только найти DIV первого изображения в слайда. Надеюсь, кто-то может понять это! Благодаря!!
sidenote: используйте 'find_all()' вместо 'findAll()': https://www.crummy.com/software/BeautifulSoup/bs4/doc/#method-names –