Хотя pyQuery эквивалент JQuery, судя по вашему прецеденту я думаю, может быть что-то вроде BeautifulSoup может быть лучше подходит для того, что вы хотите сделать.
Следующая взята с официального сайта Beautiful Soup:
Beautiful Soup библиотека Python предназначен для быстрого оборота проектов, как трафаретная выскабливание. Три особенностей делают его мощным:
Beautiful Soup предоставляет несколько простых методы и вещие идиомы для навигации, поиска и модификации дерева синтаксического разбора: инструментарий для рассечение документа и извлекая то, что вам нужно. Это не займет много кода написать заявление
Beautiful Soup автоматически преобразует входящие документы в Unicode и исходящие документы в UTF-8. Вам не нужно думать о кодировках , если в документе не указывается кодировка, а . Красивый суп не может автоопределить один. Тогда вам просто нужно указать исходную кодировку .
Beautiful Soup сидит на вершине популярных анализаторов Python как LXML и html5lib, что позволяет попробовать различные стратегии синтаксического анализа или скорости торговли гибкость.
Beautiful Soup разбирает все, что вы даете ему, и делает вещи обхода дерева для вас. Вы можете сказать «Найти все ссылки», или «Найти все ссылки класса externalLink», или «Найти все ссылки , чьи URL-адреса соответствуют« foo.com », или« Найти заголовок таблицы, который выделен жирным шрифтом текст , то дайте мне, что текст «
UAO кажется круто он совместим с Python 2.x и 3 – nkint
@nkint:.!? Если вы просто нажать на ссылку, вы должны быть в состоянии сказать, почти сразу же категории. включают Python 2.6, 2.7, 3.2 и 3.3, и это относится к улучшениям py3 несколько раз. И у него есть логотип PyPI Python 3 в верхнем левом углу. Итак, да. – abarnert