2016-07-12 7 views
0

Я начал с HtmlUnit недавно, имел некоторый успех соскоб несколько страниц и взаимодействующие с ним, действительно мощным инструментом ...Мониторинг чатов с HtmlUnit, возможно ли это?

Но, насколько мне известно, идет, я просто извлек страницу с определенным состоянием ... Мой следующий шаг - сделать HtmlUnit, чтобы читать сообщения из чата, постоянно и хранить/делать что-то, когда соответствует определенная строка/регулярное выражение. Я думал даже о взаимодействии с чатом.

Я не уверен, если HtmlUnit идет так далеко, я сделал некоторые исследования и нашел кое-что о webDriver, webWindow, и т.д., может быть, мне нужно будет работать с потоками, чтобы сделать это ....

Можете ли вы ребята указывают мне в правильном направлении?

Большое спасибо

+0

Чтобы спросить, будет ли это делать HTMLUnit, сначала спросите, как HTMLUnit выполняет то, что он сейчас делает. Считаете ли вы, что он знает, как читать файл, пока он еще открыт? Или как насчет потока данных, который даже не находится в файле (в частности, в файле HTML)? –

ответ

0

HtmlUnit пытается имитировать как можно больше реального поведения браузеров.

Если целевой сайт прост, то HtmlUnit будет работать. Но в некоторых случаях веб-сайт слишком сложный для текущего HtmlUnit, вам необходимо изолировать root cause.

Вы можете начать с WebDriver, и вы можете легко изменить реализацию, например. ChromeDriver/FirefoxDriver до HtmlUnitDriver с одной строкой.