Я имею дело с юридической проблемой и построил скрипт, поэтому мне не пришлось вручную искать веб-сайт.CloudFlare Access Отказано во время работы Download and Parse Script


import sys, urllib 

servno = 2000 
servernomax = 2676 
alldat = "" 

while True: 
    newdat = "" 
    url = "http://coc-servers.com/servers/"+str(servno) 
    wp = str(urllib.urlopen(url).read()) 
    print wp 
    ind1 = wp.find('"IP: "') 
    if ind1 != -1: 
     ind1 += 7 
     ind2 = wp.find('http',ind1) 
     ind3 = wp.find('"',ind2) 
     IPurl = wp[ind2:ind3] 
     newdat += IPurl 
    ind4 = wp.find("<th>Webiste</th>") 
    if ind4 != -1: 
     ind4 +=22 
     ind5 = wp.find('http',ind4) 
     ind6 = wp.find('"',ind5) 
     Website = wp[ind5:ind6] 
     newdat += ", " 
     newdat += Website 
    alldat += newdat 
    servno +=1 
    #print ind1, ind4 
    if servno > 2676: break 

print alldat 

Bug бесплатно, однако некоторые значения нужно настройки.


Хорошо, так оно и есть. Что? Доступ закрыт? Я был запрещен? На основе моего браузера?

Как я могу обойти это? Я знаю, что CloudFlare был создан для предотвращения DDoSing, но это вовсе не DDoS.

Я бы попытался реализовать задержку, однако первый-последний ответ - это одно и то же сообщение.

Внедрил бы несколько агентов браузера и задержите его, или я сделал это?



Следуя документам в http://wolfprojects.altervista.org/articles/change-urllib-user-agent/, я смог успешно запустить сценарий без ошибок или запретить использование облачных ограничений.

Новый сценарий:

import sys 
from urllib import FancyURLopener 

servno = 2224 #2000 
servernomax = 2676 
alldat = "" 

class MyOpener(FancyURLopener): 
    version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv: Gecko/20071127 Firefox/' 

mopen = MyOpener() 

while True: 
    newdat = "" 
    url = "http://coc-servers.com/servers/"+str(servno) 
    wp = str(mopen.open(url).read())#str(urlopen(url).read()) 
    #print wp 
    ind1 = wp.find('IP: ') 
    if ind1 != -1: 
     ind1 += 7 
     ind2 = wp.find('http',ind1) 
     ind3 = wp.find('"',ind2) 
     IPurl = wp[ind2:ind3] 
     newdat += IPurl 
    ind4 = wp.find("<th>Website</th>") 
    if ind4 != -1: 
     ind4 +=22 
     ind5 = wp.find('http',ind4) 
     ind6 = wp.find('"',ind5) 
     Website = wp[ind5:ind6] 
     newdat += ", " 
     newdat += Website 
    newdat += ";;; " 
    alldat += newdat 
    servno +=1 
    #print ind1, ind4 
    if servno > 2676: break 

print alldat 

Кто знал FancyURLOpener будет так полезно? :)