0
import mechanize
br = mechanize.Browser()
url = 'http://nseindia.com'
br.oprn(url)
и ошибкаMechanize, BS4, URLLIB, urlib2 не может открыть nseindia.com
Traceback (most recent call last):
File "<input>", line 1, in <module>
File "/usr/local/lib/python2.7/dist-packages/mechanize/_mechanize.py", line 203, in
open
return self._mech_open(url, data, timeout=timeout)
File "/usr/local/lib/python2.7/dist-packages/mechanize/_mechanize.py", line 255, in
_mech_open
raise response
httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt
я попробовать все думаю, как ....
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.
1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
br.set_handle_equiv(False)
br.set_handle_equiv(False)
ли ответ помог решить эту проблему? Если да, подумайте о принятии ответа, спасибо. – alecxe