Я знаю, тип содержимого может быть получен изКак получить тип содержимого из селена page_source
response = urllib2.urlopen(url)
content-type = response.info().getheader('Content-type')
Теперь мне нужно выполнить код JS, так я выбираю селен с Phantomjs для извлечения веб-страницы.
driver = webdriver.PhantomJS()
driver.get(url)
source = driver.page_source
Как я могу получить контент-источник из источника, не загружая веб-страницу дважды? Я знаю, что могу сохранить response.read() как html-файл, а затем драйвер визуализировать локальный html-файл, не загружая его снова. Однако это слишком медленно. Какие-либо предложения?
Thx! это действительно помогает. – SimmerChan
Не беспокойтесь, запрос главы должен быть довольно эффективным. –