2009-08-17 7 views
0

Я читаю большие документы, из которых мне нужно всего лишь 5%, могу ли я сделать следующее с HttpClient 4?Чтение и завершение потока в HttpClient 4

  1. Запрос страницы (получить или пост)
  2. Читать ответ в виде потока
  3. Кормят в SAX на основе HTML-парсер «на лету»
  4. При обнаружении некий HTML тег - Расторгнуть поток

Пожалуйста, обратите внимание, что HttpClient v 4 требуется. - Я не могу использовать V 3

ответ

0

Благодаря Кен из HttpClient списка почты здесь. ответ

Используйте метод HttpEntity # getContent() , который возвращает
java.io.InputStream, и передать, что ваш SAX на основе HTML-парсер.

http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentals.html#d4e122

Когда вы видите тег вам нужно, прекратить запрос через вызов метода HttpUriRequest # прервать().

http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentals.html#d4e285