Я написал простой скрипт для проверки URL, зависит от ошибки 404.HTTP меняется каждый раз, когда я запустить скрипт Python 2.7
Когда я запускаю скрипт на URL с 404 он действительно возвращает мне правильный ответ, однако иногда возвращает другой (503), я не понимаю, почему это происходит, я тестировал это на многих других URL-адресах, и результаты никогда не были согласованы. Кто-то будет таким и объяснит, почему мои результаты продолжают меняться, хотя фактический статус URL-адреса не получается?
Заранее спасибо за помощь
Я пытался использовать следующие модули:
URLLIB, urllib2, requets
Все они производятся те же самые противоречивые результаты.
Вот скрипты:
Я
import requests
for url in ['https://www.amazon.es/gp/product/B00QTVL0T4']:
response = requests.get(url)
response.status_code
print(response)
отклика [404] и реагирование [503] (неверно)
II
import urllib
result=''
#***** paste url into square bracket ****#
for url in ["https://www.amazon.es/gp/product/B003ODEJZ2",'https://www.amazon.fr/gp/product/B01H801C9C']:
a=urllib.urlopen(url)
e=a.getcode()
if e==404:
result+=(url+" Error_404 "+"\n")
else:
result+=(url+" Link_OK "+"\n")
print result
III
import urllib2
for url in ['https://www.amazon.es/gp/product/B003ODEJZ2','https://www.amazon.fr/gp/product/B01H801C9C','https://www.amazon.de/dp/B00B8PRE1Y']:
try:
connection = urllib2.urlopen(url)
except urllib2.HTTPError, e:
if e.getcode()==404:
print (url+" Error_404")
else:
print(url+" Link_Ok")
Я думаю, сервер может быть перегружен, и он может отбросить некоторые запросы, поэтому статус «503» в этом случае нормальный. – Andersson