2014-02-06 8 views
0

я хочу, чтобы получить информацию от Bugzilla (bugzilla.mozilla.org)python httplib.HTTPSConnection не подключен должным образом (к bugzilla.mozilla.org)?

, когда я писал код, как показано ниже,

# 
import httplib 
host = 'bugzilla.mozilla.org' 

h = httplib.HTTPSConnection(host) 
h.putrequest('GET', 'https://bugzilla.mozilla.org/index.cgi') 
h.putheader('Accept', 'application/x-ms-application, image/jpeg, application/xaml+xml, image/gif, image/pjpeg, application/x-ms-xbap, application/x-shockwave-flash, */*') 
h.putheader('User-Agent', "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; InfoPath.3)") 
h.putheader('Host', host) 
h.putheader('Connection', 'Keep-Alive') 
h.endheaders() 

response = h.getresponse() 
print response.read() 

сервер всегда возвращает

<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> 
<html><head> 
<title>301 Moved Permanently</title> 
</head><body> 
<h1>Moved Permanently</h1> 
<p>The document has moved <a href="https://bugzilla.mozilla.org/index.cgi">here</a>.</p> 
</body></html> 

но этот код работает отлично когда другие https-серверы. Кто-нибудь знает, где я ошибаюсь?

ответ

1

httplib не следует редирект (301 HTTP код), вы можете использовать вместо urrlib2:

from urllib2 import Request, urlopen 

req = Request('https://bugzilla.mozilla.org/index.cgi') 
req.add_header('Accept', 'application/x-ms-application, image/jpeg, application/xaml+xml, image/gif, image/pjpeg, application/x-ms-xbap, application/x-shockwave-flash, */*') 
req.add_header('User-Agent', "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; InfoPath.3)") 
response = urlopen(req) #NOTE: it doesn't check server's ssl certificate 
print(response.headers) 
content = response.read() 

 Смежные вопросы

  • Нет связанных вопросов^_^