2012-11-20 3 views
2

Я хочу получить исходный код всей (всей) веб-страницы, однако некоторое содержимое сайта не загружается вначале. (Кажется, это связано с Ajax) Как я могу получить содержимое, которое не загружается сразу с помощью java?Как получить исходный код веб-страницы с помощью java? (Как справиться с задержкой загрузки?)

Я попытался использовать java's url.openStrem. Но это не сработало. Я получил контент «loading...», а не реальный контент после загрузки.

спасибо.

ответ

0

Вам необходимо дистанционное управление существующим браузером (что не так просто с Java, как большинство других языков/систем/интерфейсов) или использовать безгласный браузер, который может выполнять Javascript. HTMLUnit будет последней категории.

+0

Большое спасибо. Я решил проблему с помощью htmlunit. – user1838305

0

Попробуйте использовать синтаксический анализатор html для такой вещи. Jericho Htmlparser было бы полезно здесь.

+0

Спасибо всем очень. Это очень любезно с вашей стороны. Этот парсер выглядит довольно круто. Но, кажется, анализирует html-файл, однако проблема, с которой я столкнулся, заключается в том, что я не могу получить весь (весь) html-файл. – user1838305

 Смежные вопросы

  • Нет связанных вопросов^_^