Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/463.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/apache-kafka/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何模仿Facebook';s";链接共享“;使用node.js和javascript的功能_Javascript_Jquery_Node.js_Screen Scraping - Fatal编程技术网

如何模仿Facebook';s";链接共享“;使用node.js和javascript的功能

如何模仿Facebook';s";链接共享“;使用node.js和javascript的功能,javascript,jquery,node.js,screen-scraping,Javascript,Jquery,Node.js,Screen Scraping,所以我想模仿的是Facebook提供的链接共享功能。您只需输入URL,然后FB自动从目标网站获取图像、标题和简短描述。如何在javascript中使用node.js和其他可能需要的javascript库编写此程序?我发现了一个使用PHP的fopen函数的示例,但我不希望在这个项目中包含PHP 我要问的是网络垃圾的例子吗?我需要做的就是从目标网站的元标记中检索数据,然后使用CSS选择器获取图像标记 如果有人能给我指出正确的方向,我将不胜感激。谢谢 是的,需要刮网,这是最简单的部分。困难的部分是找到

所以我想模仿的是Facebook提供的链接共享功能。您只需输入URL,然后FB自动从目标网站获取图像、标题和简短描述。如何在javascript中使用node.js和其他可能需要的javascript库编写此程序?我发现了一个使用PHP的fopen函数的示例,但我不希望在这个项目中包含PHP

我要问的是网络垃圾的例子吗?我需要做的就是从目标网站的元标记中检索数据,然后使用CSS选择器获取图像标记


如果有人能给我指出正确的方向,我将不胜感激。谢谢

是的,需要刮网,这是最简单的部分。困难的部分是找到标题、相关文本和图像的通用算法

如何刮 您可以使用jsdom在服务器中下载和创建DOM结构,并在服务器上使用jquery将其删除。正如上面@generalhenry所建议的,您可以在上找到一个很好的教程

刮什么 我想找到标题的一个好方法是:-

var h;
for(var i=6; i<=1; i++)
 if(h = $('h'+i).first()){
  break;
 }
var-h;

对于(var i=6;i是的,需要抓取网页,这是简单的部分。困难的部分是查找标题、相关文本和图像的通用算法

如何刮 您可以使用jsdom在服务器上下载和创建DOM结构,并在服务器上使用jquery将其删除

刮什么 我想找到标题的一个好方法是:-

var h;
for(var i=6; i<=1; i++)
 if(h = $('h'+i).first()){
  break;
 }
var-h;
对于(var i=6;i,请参阅post。它讨论了node.js的刮取。
您以前有很多关于使用javascript和jquery进行抓取的信息

这就是说,Facebook实际上并不猜测标题、描述和预览是什么,他们(至少在大多数情况下)从网站上的元标签中获取信息,希望fb用户更容易访问这些标签

也许你可以利用现有的元数据来获取标题、描述和img预览。可用元数据上的文档是。

看看帖子。它讨论了node.js的抓取。 您以前有很多关于使用javascript和jquery进行抓取的信息

这就是说,Facebook实际上并不猜测标题、描述和预览是什么,他们(至少在大多数情况下)从网站上的元标签中获取信息,希望fb用户更容易访问这些标签


也许你可以利用现有的元数据来获取标题、描述和img预览。可用元数据上的文档是。

从这里开始:从这里开始:是的,如果页面有opengraph元数据,这将很有帮助。在其他情况下,我们需要使用一些启发式方法。是的,感谢这两个答案。我正在寻找更多关于如何使用opengraph元数据的详细计划接近它,因为我已经阅读了列出的所有教程和指南——我做了我的研究。通过查看示例代码,我学到了最好的东西。有人可以将我链接到一些与javascript类似的代码吗?如何在页面上搜索html标记?此外,我想知道screen scrapin之间的区别是什么g和网页抓取。我想做的事需要AJAX吗?我读过很多帖子,提到AJAX由于安全问题无法从其他域的网站检索数据。@我以前没有真正做过抓取,抱歉,没有代码可以分享。关于AJAX,它不是必需的,相反,正如你所说,我甚至不可能通过AJAX获取跨站点请求。因此,您应该在服务器端执行所有的抓取操作。出于可用性目的,您始终可以在演示文稿中添加AJAX层(即,向服务器端代码发送AJAX请求,以执行抓取、检索结果并呈现结果)但是实际的抓取总是在服务器端完成的。是的,如果页面上有opengraph元数据,这将有所帮助。在其他情况下,我们需要使用一些启发式方法。是的,感谢这两个答案。我正在寻找关于如何实现它的详细计划,因为我已经阅读了列出的所有教程和指南-我做了我的研究。我学到了best通过查看示例代码。有人能把我链接到一些与javascript做过类似事情的代码吗?你如何在页面上浏览html标记?此外,我想知道屏幕抓取和网页抓取之间的区别。我尝试做的事情需要AJAX吗?我读过很多文章提到AJAX c由于安全问题,无法从另一个域的网站检索数据。@我以前没有实际执行过抓取操作,很抱歉,但没有代码可供共享。关于AJAX,它不是必需的,正如您所说,甚至不可能通过AJAX发出跨站点请求。因此,您应该在服务器端执行所有抓取操作。您始终可以添加AJA出于可用性目的,演示文稿中的X层(即AJAX请求您的服务器端代码执行刮片、检索结果并呈现结果),但实际的刮片将始终在服务器端完成。感谢您的响应。那么,为什么以下代码无法获得元数据。var meta=$('meta[name=“description”]”)。attr(“content”);它不读取$()jquery函数中的元元素吗?感谢您的响应。那么为什么下面的代码不能够获取元数据。var meta=$('meta[name=“description”]”)。attr(“content”);它不读取$()jquery函数中的元元素吗?