Я использую Boilerpipe для извлечения текста из URL, используя этот код:Извлечение HTML из URL
URL url = new URL("http://www.example.com/some-location/index.html");
String text = ArticleExtractor.INSTANCE.getText(url);
text
струнных содержит только текст страницы HTML, но мне нужно доставать весь HTML код от него.
Есть ли кто-нибудь, кто использовал эту библиотеку и знает, как извлечь код HTML?
Для получения дополнительной информации о библиотеке вы можете узнать demo page.
sun.net.www.protocol.http.HttpURLConnection $ HttpInputStream не может быть приведен к java.lang.String –
@dotNet : Извините, это вводит в заблуждение. Я исправил свой ответ. –