2016-11-22 4 views
-2

Я хочу, чтобы выбрать все теги HTML код с JsoupВыберите HTML-теги с Jsoup

<html> 
<head></head> 
<body> 
..... 
</body> 
</html> 

Я пытался что:

Document dc = Jsoup.parse(fichier, "utf-8"); 
String tags = dc.outerHtml(); 
+2

... а что на выходе из вашей попытки? Чтобы мы могли помочь с вашим вопросом, нам понадобится больше контекста: ознакомьтесь с рекомендациями по [Как задать хороший вопрос] (http://stackoverflow.com/help/how-to-ask) – emunsing

+0

Можете ли вы добавить пример того, что именно вы хотите выбрать и как он отличается от того, что вы получаете с кодом? – Pshemo

ответ

1

Ваш вопрос не ясно, но мне кажется, что вы просто хотите получить все имена узлов тегов, чтобы сделать это, вы можете разобрать html и getAllElements(), а затем перебрать элемент списка, получая nodeName() каждого из них, используя java 8, чтобы воспользоваться forEach, ваш код может быть примерно таким:

import org.jsoup.Jsoup; 
import org.jsoup.nodes.Document; 
import org.jsoup.select.Elements; 

public class JSoup { 

    public static void main(String[] args) { 

     String fichier = "<html>" + 
          "<head></head>" + 
          "<body></body>" + 
          "</html>"; 
     Document dc = Jsoup.parse(fichier, "utf-8"); 
     Elements elements = dc.getAllElements(); 
     elements.forEach(element -> System.out.println(element.nodeName())); 
    } 
} 

Этот код печатает имена всех узлов тегов:

#document 
html 
head 
body