Html 正则表达式捕获分隔符之间的字符串并排除它们
我在这个论坛上看到一个answare接近我的“请求”,但还不够 () 我的问题是:我有一个HTML页面,我将只获取该页面所有“img”标记的src,并将它们放在一个数组中,而不使用cheerio(我使用的是NodeJS) 问题是我宁愿排除分隔符。Html 正则表达式捕获分隔符之间的字符串并排除它们,html,node.js,regex,string,match,Html,Node.js,Regex,String,Match,我在这个论坛上看到一个answare接近我的“请求”,但还不够 () 我的问题是:我有一个HTML页面,我将只获取该页面所有“img”标记的src,并将它们放在一个数组中,而不使用cheerio(我使用的是NodeJS) 问题是我宁愿排除分隔符。 如何解决这个问题?是的,这在正则表达式中是可能的,但是使用本机DOM方法会更容易(可能更快,但请不要引用我的话)。让我们从正则表达式方法开始。我们可以使用捕获组轻松解析img标记的src: var html=`testhello 测试 `; var
如何解决这个问题?是的,这在正则表达式中是可能的,但是使用本机DOM方法会更容易(可能更快,但请不要引用我的话)。让我们从正则表达式方法开始。我们可以使用捕获组轻松解析
img
标记的src
:
var html=`testhello
测试
`;
var srcs=[];
html.replace(/]*>/gm,(m,$1)=>{srcs.push($1)})
console.log(srcs)代码>是的,这在正则表达式中是可能的,但是使用本机DOM方法要容易得多(可能更快,但请不要引用我的话)。让我们从正则表达式方法开始。我们可以使用捕获组轻松解析img
标记的src
:
var html=`testhello
测试
`;
var srcs=[];
html.replace(/]*>/gm,(m,$1)=>{srcs.push($1)})
console.log(srcs)
为什么不想使用cheerio?在大多数环境中,您只需将定界符放在其中–lookahead(?=)
作为结束定界符,lookahead(?您尝试了什么?非常感谢您的支持。现在我使用的是:var images=data.match(/src=“(.*.jpg)/g);为什么您不想使用cheerio?在大多数环境中,您只需将分隔符放在其中–对于结束分隔符,使用lookahead(?=)
(?您做了哪些尝试?非常感谢您的支持。现在我使用的是:var images=data.match(/src=“(.*).jpg)/g);Ty非常多。我没有使用ChereIO,因为我认为它慢得多。我得到一个带有请求模块的HTML页面,然后我只想提取每个图像的所有src。Ty非常多。我没有使用ChereIO,因为我认为它慢得多。我得到一个带有请求模块的HTML页面,然后我只想提取每个图像的所有src。