Я ищу, чтобы очистить следующий HTML структуру:Использование текста вложенного элемента в качестве селектора в BeautifulSoup
<p><strong>ID:</strong>547</p>
<p><strong>Class:</strong>foobar</p>
<p><strong>Procedures:</strong>lorem ipsum.</p>
<p>dolor sit amet.</p>
...
<p><strong>Description:</strong>curabitur at orci posuere.</p>
<p>massa nec fringilla.</p>
...
Я не слишком уверен в работе с BeautifulSoup, и я не слишком уверен, как обрабатывать факт, что идентификатор для данного раздела (id, класс, процедуры и описание) вложен в первый абзац, содержащий контент для этого раздела.
Я пытаюсь получить где-то вдоль линий следующее:
{
'id': 547,
'class': 'foobar',
'procedures': 'lorem ipsum. dolor sit amet.'
'description': 'curabitur at orci posuere. massa nec fringilla.'
}
это словарь, поэтому вы используете обычный 'str.format()' и вставляете 'dict.values ()' в них – Abdelouahab
Я не понимаю, что вы говорите. Я ищу способ разделить структуру HTML выше и бросить ее в словарь. –
ах, извините, я думал, что вы хотите сделать инверсию (из словаря, чтобы построить html) – Abdelouahab