2016-08-25 7 views
-2

Я ищу, чтобы импортировать URL из строк в file.csv, так что прекрасный суп может анализировать XML, но я понятия не имею, как сделать следующее.импорт URL из строки в csv для beautifulsoup

url = row in 'file.csv' 
 

 
soup = BeautifulSoup(urllib2.urlopen('url').read() 
 

 
letters = soup.select('h1') 
 

 
print letters

+0

Вы спрашиваете g как читать из файла csv? –

ответ

1

Используйте built-in csv module:

import csv 
import urllib2 

with open("input.csv", "rb") as f: 
    reader = csv.reader(f) 

    for row in reader: 
     url = row[0] 

     soup = BeautifulSoup(urllib2.urlopen(url)) 
     letters = soup.select('h1') 
     print url, letters 

Этот код будет работать, если у вас уже есть input.csv файл, в котором у вас есть URL в первой «клеточке» каждой строки , например:

https://google.com,some_other_data,1 
https://stackoverflow.com,some_other_data,1