Я пытаюсь извлечь некоторые данные с различных HTML-страниц, используя программу python. К сожалению, некоторые из этих страниц содержат введенные пользователем данные, которые иногда имеют «небольшие» ошибки, а именно несоответствие тегов.Python xml.dom и плохой XML
Есть ли хороший способ для xml.dom в python попытаться исправить ошибки или что-то в этом роде? В качестве альтернативы, есть ли лучший способ извлечь данные из HTML-страниц, которые могут содержать ошибки?
Beautiful Soup не так уж велик. – Geo
Я думаю, это зависит от того, что вы хотите. – Boldewyn