В JSoup следующий тестовый пример должен пройти, это не так.JSoup не перевод ampersand в ссылках в html
@Test
public void shouldPrintHrefCorrectly(){
String content= "<li><a href=\"#\">Good</a><ul><li><a href=\"article.php?boid=1865&sid=53&mid=1\">" +
"Boss</a></li><li><a href=\"article.php?boid=186&sid=53&mid=1\">" +
"heavent</a></li><li><a href=\"article.php?boid=167&sid=53&mid=1\">" +
"hellos</a></li><li><a href=\"article.php?boid=181&sid=53&mid=1\">" +
"Mr.Jackson!</a></li>";
Document document = Jsoup.parse(content, "http://www.google.co.in/");
Elements links = document.select("a[href^=article]");
Iterator<Element> iterator = links.iterator();
List<String> urls = new ArrayList<String>();
while(iterator.hasNext()){
urls.add(iterator.next().attr("href"));
}
Assert.assertTrue(urls.contains("article.php?boid=181&sid=53&mid=1"));
}
Может ли кто-нибудь из вас, пожалуйста, объяснить причину, почему он не работает?
Отличный обзор кода. Спасибо, что подняли проблему с JSoup. Хотелось бы работать с таким человеком, как вы. – Antony
Спасибо BalusC. Я исправил проблему unscape Jsoup, и она будет доступна в следующей версии. –