tag-soup

    3зной

    3ответ

    Скажем, я хочу, чтобы разобрать номер телефона из XML-строки, как это: str = """ <root> <address>123 New York, NY 10019 <div class="phone"> (212) 212-0001</div> </address>

    2зной

    2ответ

    У меня есть каталог с около 4500 XML (HTML5) файлами, и я хочу создать «манифест» их данных (по существу title и base/@href). С этой целью я использовал функцию для сбора всех соответствующих путей к

    5зной

    1ответ

    Я ищу документацию (официальную документацию, если это возможно) для библиотек TagSoup и jTidy. Я хочу использовать эти библиотеки для обработки html-файлов «tagoup», содержащих теги xml с разными про

    1зной

    2ответ

    У меня есть веб-страница с множеством элементов, создаваемых пользователем, которые нужно «очистить», и я хотел бы, чтобы очистка была выражена как преобразование XSLT, потому что она вполне подходит

    1зной

    3ответ

    мой первый пост! Проблема, с которой я столкнулась, заключается в использовании XPath и Tag-Soup для анализа веб-страницы и чтения данных. Поскольку это новостные статьи, иногда у них есть ссылки, вст

    3зной

    1ответ

    У меня есть эта структура в моем HTML документе: <p> "<em>You</em> began the evening well, Charlotte," said Mrs. Bennet with civil self–command to Miss Lucas. "<em>You</em> were Mr. Bingl

    0зной

    1ответ

    привет, ребята, я надеюсь, что это сообщение найдет вас хорошо. Итак, мои вопросы касаются tagoup, чего я хочу достичь, это иметь тег как текст другого тега, в частности, я хочу, чтобы <a href="http:/