如何使用javascript从网页中刮取链接?
我正在寻找刮掉facebook提要上显示的帖子链接。我注意到PostLink有两个共同点 和/张贴/总是在那里 我使用此代码获取页面上的所有链接,但我不知道如何仅获取与 和/张贴/在此如何使用javascript从网页中刮取链接?,javascript,html,web-scraping,Javascript,Html,Web Scraping,我正在寻找刮掉facebook提要上显示的帖子链接。我注意到PostLink有两个共同点 和/张贴/总是在那里 我使用此代码获取页面上的所有链接,但我不知道如何仅获取与 和/张贴/在此 var links = document.querySelectorAll("a[href^='https://www.facebook.com']"); for(var i = 0; i< links.length; i++){ console.log(links[i].href
var links = document.querySelectorAll("a[href^='https://www.facebook.com']");
for(var i = 0; i< links.length; i++){
console.log(links[i].href);
}
var links=document.querySelectorAll(“a[href^=”https://www.facebook.com']");
对于(变量i=0;i
我尝试了regex,这是我在学习了这个url模式的regex之后发现的
^(https://www.|http://)[a-zA-Z0-9!$]+[a-zA-Z]+/[a-zA-Z0-9]+/posts/[0-9]+$
但我不知道如何用这个来得到结果
有人能帮我吗?使用
getElementsByTagName
,转换为数组,根据您的要求进行筛选,并映射以获取URL:
[...document.getElementsByTagName("A")]
.filter(link =>
link.href.includes("https://www.facebook.com/") &&
link.href.includes("/posts/")
)
.map(link => link.href)