В python у меня есть программа, которая возвращает из списка URL-адреса.Хотите вернуть <title> тег, но возвратите <title> bad request <.title> Python 3
Некоторые из них возвращаются Bad Request, когда они собираются вместе, в списке
Например я загрузить два URL в в текстовый файл:
http://www.scientific.net/MSF
http://www.scientific.net/JMNM
это возвращение:
<title>Bad Request</title>
<title>Journal of Metastable and Nanocrystalline Materials</title>
Код работает нормально, если у меня есть только первый URL-адрес в списке. Как заставить его получить оба заголовка вместо плохого запроса?
Мой код:
url_list= []
f = open('test.txt','r') #text file with url
for line in f:
url_list.append(line)
for link in url_list:
try:
r = requests.get(link)
soup = BeautifulSoup(r.content,"html.parser")
title = soup.title
title.string = title.get_text(strip = True)
print(str(title))
except:
print("No Title Found ")
continue