1

Я хочу урезать все пробелы и новые строки и превратить результат отУдаление новой строки между тегами в HTML в Python3

<title> 

    Asian Case Research Journal (World Scientific) 

</title> 

к этому

<title>Asian Case Research Journal (World Scientific)</title> 

Мой код:

for link in url_list: 
    try: 
    r = requests.get(link) 
    soup = BeautifulSoup(r.content,"html.parser") 
    print(soup.title) 
except: 
    print("No Title Found ") 
    continue 

ответ

1
import bs4 

html = '''<title> 

    Asian Case Research Journal (World Scientific) 

</title>''' 
soup = bs4.BeautifulSoup(html, 'lxml') 
title = soup.title 
title.string = title.get_text(strip=True) 
print(str(title)) 

из:

<title>Asian Case Research Journal (World Scientific)</title> 

В BS4, тег представляет собой объект, который имеет атрибут строки, вы можете получить доступ или изменить его с . нотации, и преобразовать объект тега в объект python str с помощью str(tag)

Документ: modifying-string

0

Попробуйте это и внесите изменения в свой прецедент.

desired_string = ''.join([x.strip() for x in str(soup.title).split('\r\n')]) 

 Смежные вопросы

  • Нет связанных вопросов^_^