Я использую phantomjs
2.1.1 (на Ubuntu Server 16.04.1 и Mac OS X 10.12.2) с python selenium webdriver
.PhantomJS больше не загружается страницы GooglePlus
PhantomJS, похоже, больше не может загружать страницы googleplus с нескольких дней. Он загружает страницу с ошибкой 404
. Пытаясь загрузить ту же страницу с Firefox jeckodriver
, она загружает правую страницу; также вставляя URL-адрес в Safari, Firefox или Chrome.
Что происходит с ошибкой между googleplus и PhantomJS?
Пример кода:
#!/usr/bin/env python
from selenium import webdriver
import time
driver = webdriver.PhantomJS()
WORD = "rock"
driver.get("https://plus.google.com/s/%s/top" % WORD)
time.sleep(7)
F = open('googleplus-test-search.html','w')
F.write(driver.page_source.encode('utf-8'))
F.close()
driver.quit()
exit(0)
Loaded страница:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="utf-8">
<meta name="viewport" content="initial-scale=1, minimum-scale=1, width=device-width">
<title>
Error 404 (Non trovato)!!1</title>
<style>
*{margin:0;padding:0}html,code{font:15px/22px arial,sans-serif}html{background:#fff;color:#222;padding:15px}body{color:#222;text-align:unset;margin:7% auto 0;max-width:390px;min-height:180px;padding:30px 0 15px;}* >
body{background:url(//www.google.com/images/errors/robot.png) 100% 5px no-repeat;padding-right:205px}p{margin:11px 0 22px;overflow:hidden}pre{white-space:pre-wrap;}ins{color:#777;text-decoration:none}a img{border:0}@media screen and (max-width:772px){body{background:none;margin-top:0;max-width:none;padding-right:0}}#logo{background:url(//www.google.com/images/branding/googlelogo/1x/googlelogo_color_150x54dp.png) no-repeat;margin-left:-5px}@media only screen and (min-resolution:192dpi){#logo{background:url(//www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png) no-repeat 0% 0%/100% 100%;-moz-border-image:url(//www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png) 0}}@media only screen and (-webkit-min-device-pixel-ratio:2){#logo{background:url(//www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png) no-repeat;-webkit-background-size:100% 100%}}#logo{display:inline-block;height:54px;width:150px}</style>
</head>
<body>
<div id="af-error-container">
<a href="//www.google.com/">
<span id="logo" aria-label="Google">
</span>
</a>
<p>
<b>
404.</b>
<ins>
Errore.</ins>
</p>
<p>
Impossibile trovare l'URL richiesto su questo server. <ins>
Nessun'altra informazione disponibile.</ins>
</p>
</div>
</body>
</html>
Обнаружено ... это была проблема 'userAgent'. Устанавливается настраиваемый пользовательский элемент userAgent для PhantomJS. –