У меня есть файл с кучей информации. Например, все линии следуют той же схеме, как это:Как использовать функцию split для файла в python?
<school>Nebraska</school>
Я пытаюсь использовать функцию разделения только восстановить «Небраска». Это то, что у меня есть до сих пор, но я не уверен, что делать, чтобы отключить обе части, а не только первую.
with open('Pro.txt') as fo:
for rec in fo:
print(rec.split('>')[1])
С этим я получаю:
Nebraska</school
Если это XML или HTML, и это выглядит, как будто это, вы должны используйте соответствующий синтаксический анализатор, такой как BeautifulSoup (HTML) или LXML (XML). Python также поставляется с парсерами, которые будут делать трюк, хотя те, которые я предложил, лучше. – kindall
Используйте XML-парсер, либо [встроенный] (https://docs.python.org/3/library/xml.html), либо модуль PyPI, например 'lxml' или' BeautifulSoup'. Не пытайтесь перевернуть собственный XML-код синтаксического анализа. – ShadowRanger
У вас есть пример файла? Возможно, вы имеете дело с подмножеством * ML, с которым может быть легче работать. – Iluvatar