Javascript 谷歌应用程序脚本中的条带HTML标记
我正在寻找fastets从谷歌应用程序脚本中的内容中剥离HTML标记的方法 目前,我正在使用以下函数进行HTML解析:Javascript 谷歌应用程序脚本中的条带HTML标记,javascript,html,google-apps-script,google-apps,Javascript,Html,Google Apps Script,Google Apps,我正在寻找fastets从谷歌应用程序脚本中的内容中剥离HTML标记的方法 目前,我正在使用以下函数进行HTML解析: function getTextFromHtml(body) { return getTextFromNode(Xml.parse(body, true).getElement()); } function getTextFromNode(x) { switch(x.toString()) { case 'XmlText': return x.toXmlString
function getTextFromHtml(body) {
return getTextFromNode(Xml.parse(body, true).getElement());
}
function getTextFromNode(x) {
switch(x.toString()) {
case 'XmlText': return x.toXmlString();
case 'XmlElement': return x.getNodes().map(getTextFromNode).join('');
default: return '';
}
}
但长期以来,HTML的这种方式是如此低效
HTML内容示例:
有什么想法吗?这将从输入中删除所有标记
var text = html.replace(/<[^>]+>/g, "");
var text=html.replace(/]+>/g,”);
这将从输入中删除所有标记
var text = html.replace(/<[^>]+>/g, "");
var text=html.replace(/]+>/g,”);
如果要替换的内容总是用Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");
Regex rgx=newregex(someString);
字符串结果=rgx.Replace(“]*>”,“”);
如果要替换的内容总是用Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");
Regex rgx=newregex(someString);
字符串结果=rgx.Replace(“]*>”,“”);