2015-06-17 1 views
1

Скребок - это новая тема для меня, и я изо всех сил пытаюсь ее понять. Примечание. Я использую wordpress.Scrape Price Title Изображение продукта с сайта

Например, скажем, для моего ботинка Блог Я хочу показать продукт FootLocker, соскабливая. Как мне узнать цену, название и изображение продукта от Footlocker?

Из моих исследований, похоже, DomDocument в PHP или Python BeautifulSoup могут быть использованы для этой цели, но я не уверен. Для моей ситуации (извлечения цены, названия, изображения) какой метод будет работать?

Будет ли DOMdocument работать для этого? На самом деле нужны некоторые рекомендации.

EDIT

Вот образец HTML

НАЗВАНИЕ ПРОДУКТА

<div class="title" data-info="product_title"> 
<h1 tabindex="698">Jordan Flight Origin 2 - Men's</h1> 
</div> 

ЦЕНА ПРОДУКЦИИ

<div class="regular_price"> 
<span class="label" tabindex="-1"></span> 
<span class="value">$114.99</span> 
</div> 

IMAGE ПРОДУКТ

<div class="regular_price"> 
<span class="label" tabindex="-1"></span> 
<span class="value">$114.99</span> 
</div> 

URL ПРОДУКТА

http://www.footlocker.com/product/model:234353/sku:05155015/jordan-flight-origin-2-mens/grey/multicolor/?cm=newarrivalsshoessupercat

+0

Да BeautifulSoup может помочь вам ...... Можете ли вы предоставить образец HTML-кода, где вам нужно извлечь данные. –

+0

@pyAnna см. Мое редактирование. Надеюсь, я скопировал правильный html. Does BeautifulSoup делает сайт медленным? – leko

ответ

0
import urllib2 
import re 
result = [] 
response = urllib2.urlopen('http://www.footlocker.com/product/model:234353/sku:05155015/jordan-flight-origin-2-mens/grey/multicolor/?cm=newarrivalsshoessupercat') 
html = response.read() 
m = re.search('<link rel="image_src" href="(.+?)"', html) 
if m: 
    image = m.group(1) 
result.append(image) 
m = re.search('<meta name="title" content="(.+?)"', html) 
if m: 
    product = m.group(1) 
result.append(product) 
print result 

Я не использовал BeautifulSoup и просто написал простой код так, чтобы сделать вашу работу .... надеюсь, что это работает отлично, сообщите мне об изменениях, если потребуется ... откровенно говоря, я никогда не думал о проблемах с временной сложностью, связанных с BeautifulSoup.

+0

Спасибо, что помогает! Но я не понимаю ... как вы показываете эти данные на веб-сайте Wordpress? Где я могу сохранить ваш код beautifulsoup? Я сохраняю его в своей теме wordpress как php-файл? – leko

+0

@leko откровенно говоря, у меня нет такой идеи о Wordpress, возможно, ребята из Wordpress помогут вам в том же, поставят вопрос о том же брате. –

 Смежные вопросы

  • Нет связанных вопросов^_^