Javascript 谷歌应用程序脚本中的条带HTML标记_Javascript_Html_Google Apps Script_Google Apps

Javascript 谷歌应用程序脚本中的条带HTML标记

javascript html google-apps-script

Javascript 谷歌应用程序脚本中的条带HTML标记,javascript,html,google-apps-script,google-apps,Javascript,Html,Google Apps Script,Google Apps,我正在寻找fastets从谷歌应用程序脚本中的内容中剥离HTML标记的方法目前，我正在使用以下函数进行HTML解析： function getTextFromHtml(body) { return getTextFromNode(Xml.parse(body, true).getElement()); } function getTextFromNode(x) { switch(x.toString()) { case 'XmlText': return x.toXmlString

我正在寻找fastets从谷歌应用程序脚本中的内容中剥离HTML标记的方法

目前，我正在使用以下函数进行HTML解析：

function getTextFromHtml(body) {
  return getTextFromNode(Xml.parse(body, true).getElement());
}

function getTextFromNode(x) {
 switch(x.toString()) {
  case 'XmlText': return x.toXmlString();
  case 'XmlElement': return x.getNodes().map(getTextFromNode).join('');
  default: return '';
 }
}

但长期以来，HTML的这种方式是如此低效

HTML内容示例：

有什么想法吗？

这将从输入中删除所有标记

 var text = html.replace(/<[^>]+>/g, "");

var text=html.replace（/]+>/g，”）；

这将从输入中删除所有标记

 var text = html.replace(/<[^>]+>/g, "");

var text=html.replace（/]+>/g，”）；

如果要替换的内容总是用包装，您可以这样做

Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");

Regex rgx=newregex（someString）；
字符串结果=rgx.Replace（“]*>”，“”）；

如果要替换的内容总是用包装，您可以这样做

Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");

Regex rgx=newregex（someString）；
字符串结果=rgx.Replace（“]*>”，“”）；