Мне нужно знать, как разбирать XML-файл в Spark. Я получаю потоковые данные от kafka, а затем нужно разбирать эти потоковые данные.Анализ XML-данных в Apache Spark
Вот мой Спарк код для получения данных:
directKafkaStream.foreachRDD(rdd ->{
rdd.foreach(s ->{
System.out.println("&&&&&&&&&&&&&&&&&" +s._2);
});
И результаты:
<root>
<student>
<name>john</name>
<marks>90</marks>
</student>
</root>
Как передать эти XML-элементы?
Вы искали предыдущие вопросы по этому вопросу? Например: http://stackoverflow.com/questions/33078221/xml-processing-in-spark –
@Binary Nerd, спасибо за ответ. Мое искровое приложение читает данные по строкам. Поэтому мне нужно разбирать строки за строкой, не используя начальный элемент и/или конечный элемент. – user6325753