Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/86.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/429.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 谷歌应用程序脚本中的条带HTML标记_Javascript_Html_Google Apps Script_Google Apps - Fatal编程技术网

Javascript 谷歌应用程序脚本中的条带HTML标记

Javascript 谷歌应用程序脚本中的条带HTML标记,javascript,html,google-apps-script,google-apps,Javascript,Html,Google Apps Script,Google Apps,我正在寻找fastets从谷歌应用程序脚本中的内容中剥离HTML标记的方法 目前,我正在使用以下函数进行HTML解析: function getTextFromHtml(body) { return getTextFromNode(Xml.parse(body, true).getElement()); } function getTextFromNode(x) { switch(x.toString()) { case 'XmlText': return x.toXmlString

我正在寻找fastets从谷歌应用程序脚本中的内容中剥离HTML标记的方法

目前,我正在使用以下函数进行HTML解析:

function getTextFromHtml(body) {
  return getTextFromNode(Xml.parse(body, true).getElement());
}

function getTextFromNode(x) {
 switch(x.toString()) {
  case 'XmlText': return x.toXmlString();
  case 'XmlElement': return x.getNodes().map(getTextFromNode).join('');
  default: return '';
 }
}
但长期以来,HTML的这种方式是如此低效

HTML内容示例:


有什么想法吗?

这将从输入中删除所有标记

 var text = html.replace(/<[^>]+>/g, "");
var text=html.replace(/]+>/g,”);

这将从输入中删除所有标记

 var text = html.replace(/<[^>]+>/g, "");
var text=html.replace(/]+>/g,”);

如果要替换的内容总是用包装,您可以这样做

Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");
Regex rgx=newregex(someString);
字符串结果=rgx.Replace(“]*>”,“”);

如果要替换的内容总是用包装,您可以这样做

Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");
Regex rgx=newregex(someString);
字符串结果=rgx.Replace(“]*>”,“”);