В настоящее время я пишу небольшой тестовый webscraper с использованием запросов python и библиотек lxml. Я пытаюсь извлечь текст из строк таблицы из this site, используя xpaths, чтобы однозначно идентифицировать таблицу. Поскольку сама таблица может быть идентифицирована только по имени ее класса и с учетом того факта, что имя класса не является уникальным, мне пришлось использовать родительский элемент div, чтобы указать его. В таблице в вопросе, в котором перечислены даты сезона заказа, киносъемки и airdates для шоу игра престолов, которую я пытаюсь выбрать по следующему пути:Как разобрать текст из элемента таблицы html
tree.xpath('//div[@id = "mw-content-text"]//table[@class = "wikitable"]//text()')
По какой-то причине, когда я напечатайте этот путь в оболочке, он возвращает пустой список. Я считаю, что печать этого пути будет просто отображать весь текст в таблице, который я пытался сделать, чтобы я мог реально получить содержимое; однако мне действительно нужно было бы печатать каждую строку таблицы.
Есть ли что-то не так с этим xpath? Если да, то каков правильный способ печати содержимого таблицы?