Я изучаю Python и BeautifulSoup, чтобы очистить данные из Интернета и прочитать таблицу HTML. Я могу прочитать его в Open Office, и он говорит, что это таблица № 11.Как вы можете получить все строки из определенной таблицы с помощью BeautifulSoup?
Кажется, что BeautifulSoup является предпочтительным выбором, но может ли кто-нибудь сказать мне, как захватить конкретный стол и все строки? Я просмотрел документацию по модулю, но не могу обойти его. Многие из примеров, которые я нашел в Интернете, похоже, делают больше, чем мне нужно.
Это была трюка! Код работал, и я должен иметь возможность изменять его по мере необходимости. Большое спасибо. И последний вопрос. Я могу следовать за кодом, кроме тех случаев, когда вы просматриваете таблицу для детей th и tr. Это просто поиск в моей таблице и возврат строк таблицы и таблицы? Если бы мне нужны только строки таблицы, я бы просто искал только tr. большое спасибо! – Btibert3
Да, '.findChildren (['th', 'tr'])' ищет элементы с типом тега 'th' или' tr'. Если вы просто хотите найти элементы 'tr', вы должны использовать' .findChildren ('tr') '(обратите внимание, что нет списка, просто строка) –
Также стоит отметить, что [PyQuery] (https://pythonhosted.org /pyquery/api.html) - действительно очень хорошая альтернатива BeautifulSoup. –