Я пытался вырезать некоторые данные из файлов HTML. У меня есть логическая кодировка, чтобы получить нужные ячейки. Теперь я изо всех сил, чтобы получить реальное содержимое ячейки '':Как вы получаете текст из HTML 'datacell' с помощью BeautifulSoup
вот мой HTM надрез
headerRows [0] [10] .contents
[<font size="+0"><font face="serif" size="1"><b>Apples Produced</b><font size="3">
</font></font></font>]
Обратите внимание, что это список элемент из Python [].
Мне нужна ценность Яблоки, но не могу добраться до нее.
Любые предложения будут оценены
Предложения по хорошей книге, которая объясняет это заработало бы мою вечную благодарность
Спасибо за этот ответ. Однако, есть ли более общий ответ. Что произойдет, если ячейка не имеет смелое атрибут
говорят, что это:
[<font size="+0"><font face="serif" size="1"><I>Apples Produced</I><font size="3">
</font></font></font>]
Яблоки Произведено
Я пытаюсь научиться читать/понимать документацию и ваши ответ поможет
Я очень ценю эту помощь. Самое лучшее в этих ответах состоит в том, что из них намного легче обобщить, тогда я смог сделать это из документации BeautifulSoup. Я научился программировать в эпоху Fortran, и я, пока мне нравится изучать питон, и я поражен его мощью - пример BeautifulSoup. сделать когернету всей документацией для меня непросто.
Приветствие