Я хочу, чтобы очистить данные по этой ссылкепитон скрип веб-страницы и анализировать содержимое
http://www.realclearpolitics.com/epolls/json/5491_historical.js?1453388629140&callback=return_json
Я не уверен, какой тип этой связи является то, это HTML или JSON или что-то другое. Извините за мои плохие знания в сети. Но я стараюсь использовать следующий код для очистки:
import requests
url='http://www.realclearpolitics.com/epolls/json/5491_historical.js?1453388629140&callback=return_json'
source=requests.get(url).text
Тип источника - это юникод. Я также пытаюсь использовать urllib2 для очистки, например:
source2=urllib2.urlopen(url).read()
Тип источника2 - это строка. Я не уверен, какой метод лучше. Поскольку ссылка не похожа на обычную веб-страницу, она содержит разные теги. Если я хочу очистить очищенные данные и сформировать данные dataframe (например, dataframe pandas), какой метод или процесс я должен соблюдать/
Спасибо.
@depperm, спасибо, что ответит. Я обновляю ссылку. Теперь он должен работать. –