Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/77.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/visual-studio/7.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用javascript从网页中刮取链接?_Javascript_Html_Web Scraping - Fatal编程技术网

如何使用javascript从网页中刮取链接?

如何使用javascript从网页中刮取链接?,javascript,html,web-scraping,Javascript,Html,Web Scraping,我正在寻找刮掉facebook提要上显示的帖子链接。我注意到PostLink有两个共同点 和/张贴/总是在那里 我使用此代码获取页面上的所有链接,但我不知道如何仅获取与 和/张贴/在此 var links = document.querySelectorAll("a[href^='https://www.facebook.com']"); for(var i = 0; i< links.length; i++){ console.log(links[i].href

我正在寻找刮掉facebook提要上显示的帖子链接。我注意到PostLink有两个共同点

和/张贴/总是在那里

我使用此代码获取页面上的所有链接,但我不知道如何仅获取与

和/张贴/在此

var links = document.querySelectorAll("a[href^='https://www.facebook.com']");

for(var i = 0; i< links.length; i++){
  console.log(links[i].href);
}
var links=document.querySelectorAll(“a[href^=”https://www.facebook.com']");
对于(变量i=0;i
我尝试了regex,这是我在学习了这个url模式的regex之后发现的

^(https://www.|http://)[a-zA-Z0-9!$]+[a-zA-Z]+/[a-zA-Z0-9]+/posts/[0-9]+$

但我不知道如何用这个来得到结果


有人能帮我吗?

使用
getElementsByTagName
,转换为数组,根据您的要求进行筛选,并映射以获取URL:

[...document.getElementsByTagName("A")]
.filter(link => 
  link.href.includes("https://www.facebook.com/") &&
  link.href.includes("/posts/")
)
.map(link => link.href)