Javascript 如何从带有其他文本的网页中删除html标记?

Javascript 如何从带有其他文本的网页中删除html标记?,javascript,html,dom,tampermonkey,Javascript,Html,Dom,Tampermonkey,我正在为一个站点编写一个简单的解析器,我是新手。然而,该网站有内部链接。例如,链接如下所示: 我需要删除“文本 我已使用以下脚本成功删除wbr标记: del = document.getElementsByTagName("wbr"); if (del.length > 0) { for (i = 0, j = del.length; i < j; i++) { del[i].parentNode.removeChild(del[i]); } } del=docu


我正在为一个站点编写一个简单的解析器,我是新手。然而,该网站有内部链接。例如,链接如下所示:


我需要删除
文本
我已使用以下脚本成功删除wbr标记:

del = document.getElementsByTagName("wbr");
 if (del.length > 0) {
  for (i = 0, j = del.length; i < j; i++) {
   del[i].parentNode.removeChild(del[i]);
 }
}
del=document.getElementsByTagName(“wbr”);
如果(删除长度>0){
对于(i=0,j=del.length;i
但我仍然无法删除引号,因此我的新文本如下所示:

<a href="www.example1.com">[The Aven""gers [720p, DVDRIP]</a>
<a href="www.example2.com"><[Home alo""ne [1080p, BDRIP]</a>


删除wbr标记后,可以使用javascript的replace()函数删除引号,如下所示:

del = document.getElementsByTagName("wbr");
if (del.length > 0) {
   for (i = 0, j = del.length; i < j; i++) {
      var parentElement = del[i].parentNode;
      parentElement.removeChild(del[i]);
      parentElement.text().replace(/"/g, '');
   }
}
del=document.getElementsByTagName(“wbr”);
如果(删除长度>0){
对于(i=0,j=del.length;i
这个问题非常令人困惑,但在Fiddle上运行它可以清楚地表明,您只需要从html正文中删除引号,这样就可以完成以下工作:

document.body.innerHTML = document.body.innerHTML.replace(/"/g, '');

查看正在工作的小提琴。让我知道这是否是您正在寻找的

您是否可以将[Aven”“gers[720p,DVDRIP]作为字符串访问?抱歉,我无法正确回答您的问题。我有自己的Google Chrome扩展名(用于解析)和Tampermonkey扩展来与DOM一起工作。我对这类事情很不了解。你的问题不清楚,[Aven”“gers[720p,DVDRIP]是否放在文档正文的某个地方?比如document.body.innerHTML=[The Aven”“gers[720p,DVDRIP],你想删除吗?”“从它开始?我编辑了我的问题。那个网站是torrent tracker,我解析链接文本以查找必要的电影或仅1080p版本的电影