2016-12-18 4 views
0

Как выбрать текст в теге span, который исключает ненужные символы «& nbsp»? Мне нужно только число (символ евро в конце будет приятным, но это не обязательно). Обратите внимание, что цифры меняются, они не совпадают.XPath, как удалить знак евро ненужных символов?

<span class="price">15.900&nbsp;€</span> 
+0

Это XML или HTML? – spender

+0

text = text.Replace (" ", ""); HTML-код: –

+0

HTML, я практикую webscraping. – CsharpNoob

ответ

1

Если вы используете C# и XPath, то предполагается, что вы написать выражение XPath в виде строки C# вы можете использовать "translate(//span[@class = 'price'], '\u00A0', '')".

Работа образца (в Javascript) является

console.log(document.evaluate("translate(//span[@class = 'price'], '\u00A0', '')", document, null, XPathResult.ANY_TYPE, null).stringValue);
<span class="price">15.900&nbsp;€</span>

+0

Можете ли вы уточнить, что/u00A0, '' part? – CsharpNoob

+0

Ну, см. Escape-последовательность Unicode в документации https://msdn.microsoft.com/en-us/library/ms228362.aspx#String%20Escape%20Sequences. И это '\ u00A0', а не'/u00A0'. –

+0

И в HTML ссылка на сущность 'nbsp;' - это просто HTML-способ записи символа ЮКОЙК U00A0, которые строковые литералы Javascript или C# позволяют вам бежать как '\ u00A0'. –