Когда веб-браузер запрашивает загрузку URL-адреса, он выдаст HTTP-запрос на веб-сервер, чтобы получить ответ, соответствующий этому HTTP-запросу. Получив ответ, он будет обрабатывать ответ (документы HTML) для получения других ресурсов, если таковые имеются. Поэтому веб-браузер автоматически выдаст больше HTTP-запросов к веб-серверу.Имитация поведения веб-браузеров в Java
В Java мы можем использовать java.net.URLConnection
для запроса HTTP-запроса для определенного URL-адреса. Ответ будет доступен после очень короткого времени. Затем нам нужно будет самостоятельно проанализировать полученный HTML-ответ и выдать HTTP-запрос для каждого из обнаруженных ресурсов один за другим.
Есть ли способ, с помощью которого мы можем автоматически передавать эти автоматические запросы HTTP в Java?
Или, по крайней мере, существует какой-либо парсер, который анализирует HTML-документ и извлекает список всех ресурсов, которые необходимо запросить?
Ищете «браузер модели java simulate», чтобы вы могли туда попасть. http://htmlunit.sourceforge.net/ – scrappedcola
Вы, по сути, спрашиваете: «Как написать веб-браузер на Java?» который является слишком широкой темой для формата вопросов и ответов, который должен быть SO. В противном случае вы просите рекомендации для инструмента анализа синтаксического анализа HTML - см. # 4 в разделе [help/on-topic] –