Javascript 如何从带有其他文本的网页中删除html标记?
Javascript 如何从带有其他文本的网页中删除html标记?,javascript,html,dom,tampermonkey,Javascript,Html,Dom,Tampermonkey,我正在为一个站点编写一个简单的解析器,我是新手。然而,该网站有内部链接。例如,链接如下所示: 我需要删除“文本 我已使用以下脚本成功删除wbr标记: del = document.getElementsByTagName("wbr"); if (del.length > 0) { for (i = 0, j = del.length; i < j; i++) { del[i].parentNode.removeChild(del[i]); } } del=docu
我正在为一个站点编写一个简单的解析器,我是新手。然而,该网站有内部链接。例如,链接如下所示:
我需要删除
“
文本我已使用以下脚本成功删除wbr标记:
del = document.getElementsByTagName("wbr");
if (del.length > 0) {
for (i = 0, j = del.length; i < j; i++) {
del[i].parentNode.removeChild(del[i]);
}
}
del=document.getElementsByTagName(“wbr”);
如果(删除长度>0){
对于(i=0,j=del.length;i
但我仍然无法删除引号,因此我的新文本如下所示:<a href="www.example1.com">[The Aven""gers [720p, DVDRIP]</a>
<a href="www.example2.com"><[Home alo""ne [1080p, BDRIP]</a>
删除wbr标记后,可以使用javascript的replace()函数删除引号,如下所示:
del = document.getElementsByTagName("wbr");
if (del.length > 0) {
for (i = 0, j = del.length; i < j; i++) {
var parentElement = del[i].parentNode;
parentElement.removeChild(del[i]);
parentElement.text().replace(/"/g, '');
}
}
del=document.getElementsByTagName(“wbr”);
如果(删除长度>0){
对于(i=0,j=del.length;i
这个问题非常令人困惑,但在Fiddle上运行它可以清楚地表明,您只需要从html正文中删除引号,这样就可以完成以下工作:
document.body.innerHTML = document.body.innerHTML.replace(/"/g, '');
查看正在工作的小提琴。让我知道这是否是您正在寻找的您是否可以将[Aven”“gers[720p,DVDRIP]作为字符串访问?抱歉,我无法正确回答您的问题。我有自己的Google Chrome扩展名(用于解析)和Tampermonkey扩展来与DOM一起工作。我对这类事情很不了解。你的问题不清楚,[Aven”“gers[720p,DVDRIP]是否放在文档正文的某个地方?比如document.body.innerHTML=[The Aven”“gers[720p,DVDRIP],你想删除吗?”“从它开始?我编辑了我的问题。那个网站是torrent tracker,我解析链接文本以查找必要的电影或仅1080p版本的电影