2017-02-14 14 views
0

Я пытаюсь проанализировать приведенный ниже пример XML-файла, чтобы получить некоторые данные из него. Ниже приведен XML-файл:nodejs elementtree npm xml parsing

<Benchmark xmlns="http://checklists.nist.gov/xccdf/1.1" xmlns:xsi="www.w3.org/2001/XMLSchema-instance" id="SAP-HANA" resolved="1" xml:lang="en-US"> 
<status date="2016-03-17">draft</status> 
<title xmlns:xhtml="http://www.w3.org/1999/xhtml" xml:lang="en-US">Guide to the Secure Configuration of SAP HANA</title> 
<version>0.1.28</version> 

<Profile id="profile1"> 
    <title xmlns:xhtml="http://www.w3.org/1999/xhtml" xml:lang="en-US">text1</title> 
    <select idref="This is rule 1" selected="true"/> 
    <set-value idref="ssfs_master_key_timeout">20</set-value> 
</Profile> 

<Profile id="profile2"> 
    <title xmlns:xhtml="http://www.w3.org/1999/xhtml" xml:lang="en-US">text2</title> 
    <select idref="this is rule1" selected="true"/> 
    <select idref="this is rule1" selected="true"/> 
    <select idref="this is rule1" selected="true"/> 
</Profile> 
</Benchmark> 

Из этого XML-файл, мне нужно, чтобы получить все профили (profile1, PROFILE2 ...), а затем для каждого профиля в тег заголовка, мне нужно, чтобы получить его текстовое содержание. Я пытаюсь для того чтобы достигнуть somehting как это:

for all profile in XML{ 
    get its attribute "id". 
    get its <title> tag's text content. 
} 

В приведенном ниже примере это ожидаемый результат:

profile1 
text1 
profile2 
text2 // but in my code, it is always coming text1. I am not aware of, how to place [i] 

Я могу получить идентификатор. Но не удалось получить текстовое содержимое для своего тега. Вот мой код:

var fs = require('fs'); 
var et = require('elementtree'); 
var XML = et.XML; 
var ElementTree = et.ElementTree; 
var element = et.Element; 
var subElement = et.SubElement; 

var data, etree; 

data = fs.readFileSync('my.xml').toString(); 
etree = et.parse(data); 
var length = etree.findall('./Profile').length; 
for (var i = 0; i < length; i++) { 
    console.log(etree.findall('./Profile')[i].get('id')); 
    console.log(etree.findtext('./Profile/title')); // dont know, where to place [i] 

// var profile = etree.findall('./Profile')[i].get('id'); 
// console.log(etree.findtext('./Profile'[@id=’profile’]'/title')); 

    //console.log(etree.findall('./Profile'[i]'/title')); 
    //console.log(list[i]); 
} 

ответ

1

Вы можете получить текст, как это:

console.log(etree.findall('./Profile')[i].find('title').text); 

Но я бы также рефакторинг кода немного, чтобы не вызывать .findall несколько раз, как это:

var profiles = etree.findall('./Profile'); 
 

 
for (var i = 0; i < profiles.length; i++) { 
 
\t var profile = profiles[i]; 
 

 
\t console.log(profile.get('id')); 
 
\t console.log(profile.find('title').text); 
 
}

Надеется, что это помогает.

+0

Привет Антонио, спасибо за ответ. Это сработало. :) –

+0

@HemantYadav приветствую :) –

+0

Привет Антонио, я столкнулся с еще одной проблемой с модулем elementTree. Можете ли вы предложить любой хороший модуль nodejs для проблемы, заданной в ссылке ниже. Возможно, мне придется продолжить глубокое погружение в синтаксический анализ xml позже. Я снова могу столкнуться с проблемой. Или любая хорошая документация для модуля elemenTree. http://stackoverflow.com/questions/42553153/nodejs-elementtree-npm-xml-parsing-and-merging –