Как я могу извлечь информацию с страницы imdb borntoday?beautifulsoup imdb borntoday страница
Я рассмотрел этот вопрос, и на него нет ответа.
Webscraping an IMDb page using BeautifulSoup
Я попытался код ниже
import urllib2
from bs4 import BeautifulSoup
test_url='https://m.imdb.com/feature/bornondate'
url=urllib2.urlopen(test_url)
html_text=url.read()
soup=BeautifulSoup(html_text)
poster=soup.find('a','poster')
print poster
print type(poster)
print type(soup)
print html_text
url.close()
Я пытаюсь найти по крайней мере один элемент перед держать логику в цикле.
Содержание html-страниц приведено ниже. Выходной плакат и тип (плакат) не дают мне ничего. Пожалуйста, помогите мне, где мне не хватает кода.
<section class="posters list">
<h1>January 18</h1>
<a href="/name/nm0000126/" class="poster "><img src="https://images-na.ssl-images-amazon.com/images/M/[email protected]_V1._CR0,0,419,618_SX40_SY59.jpg" style="background:url('http://i.media-imdb.com/images/mobile/people-40x59-fade.png')" width="40" height="59"><div class="label"><span class="title">Kevin Costner</span><div class="detail">Actor, "Dances with Wolves"</div></div></a>
Thanks, Phani.
Пожалуйста, пост код, который вы пробовали. –
Проверьте ответ. Это то, что вы искали? – MYGz
Да, я хочу только 10 лучших актеров. Я сталкиваюсь с некоторыми проблемами по импорту dryscrape, но похоже, что код, который вы опубликовали, должен работать. Также я понял, что динамическое содержимое html-извлечения невозможно с помощью beautifulsoup. Спасибо за ваше время в ответе. – ppeddi