2010-09-08 4 views
0

Я использую Perl.Найти метки на сайте HTML

У меня есть тег, например: «XYZ_PKM_HTML» Я хотел бы быть в состоянии обеспечить базовый URL, например: www.example.com и получить страницу HTML (не обязательно главной страницы , thats easy), где появляется этот тег. Возможно ли это? Есть идеи? (Или уже сделаны модули, посмотрели на CPAN, были некоторые интересные вещи, но не может быть установлен)

Спасибо,

ответ

1

Вы, кажется, хочет реализовать веб-сайт искатель и поисковый. Вы обычно делаете первый с WWW::Mechanize, а последний с HTML::Twig

+0

Прежде всего, спасибо за ответ. Во-вторых, я уже знаком с Mechanize, но так как я никогда не реализовал искателя, мне интересно, как его решить, как я смогу пройти через все ссылки на сайт, а не другие, не связанные с ссылками на сайты (объявления и например). также, возможно ли, что он будет работать в течение некоторого времени, если на сайте много страниц, какие-либо рекомендации? – snoofkin

0

Попробуйте веб-скребок в Perl. Web-Scraper module info. С этим легко работать, и вы можете искать определенные теги или элементы и получать данные от него.