2016-12-16 8 views
0

Я ищу способ быстрого доступа к тэгам HTML из контента в Google Apps Script.Табличные теги HTML в скрипте Google Apps

На данный момент я использую эти функции HTML разборе:

function getTextFromHtml(body) { 
    return getTextFromNode(Xml.parse(body, true).getElement()); 
} 

function getTextFromNode(x) { 
switch(x.toString()) { 
    case 'XmlText': return x.toXmlString(); 
    case 'XmlElement': return x.getNodes().map(getTextFromNode).join(''); 
    default: return ''; 
} 
} 

Но для этого, как длинный HTML-формате настолько неэффективно.

Пример содержимого HTML: http://pastebin.com/FmB4hvN2

Любые идеи?

ответ

1

Это удалит все теги с входа.

var text = html.replace(/<[^>]+>/g, ""); 
+0

Вы правы! Благодаря! – Labradorcode

1

Если содержание вы хотите заменить всегда обматывают < и>, вы можете сделать

Regex rgx = new Regex(someString); 
string result = rgx.Replace("<[^>]*>", "");