Html Facebook如何知道从文章中解析出什么图像?

Html Facebook如何知道从文章中解析出什么图像?,html,image,parsing,facebook,Html,Image,Parsing,Facebook,首先,我想说,我真的不确定在哪里张贴这篇文章,但它与编程非常相关。如果它放错了地方,我道歉,请让我知道我应该把它放在哪里 在朋友墙上分享文章时,facebook会抓取文章的缩略图。他们如何总是从文章中获得正确的缩略图 例如,它不会抓住logo img元素,而是抓住与文章对应的正确图像元素 我希望做一些类似的事情,并且想知道一种解析html的好方法,以找到这个示例中的图像。谢谢。他们并不总是能抓住正确的图像,即使有一些很好的逻辑 在很多情况下,我看到了一个可供选择的缩略图列表,这意味着Facebo

首先,我想说,我真的不确定在哪里张贴这篇文章,但它与编程非常相关。如果它放错了地方,我道歉,请让我知道我应该把它放在哪里

在朋友墙上分享文章时,facebook会抓取文章的缩略图。他们如何总是从文章中获得正确的缩略图

例如,它不会抓住logo img元素,而是抓住与文章对应的正确图像元素


我希望做一些类似的事情,并且想知道一种解析html的好方法,以找到这个示例中的图像。谢谢。

他们并不总是能抓住正确的图像,即使有一些很好的逻辑

在很多情况下,我看到了一个可供选择的缩略图列表,这意味着Facebook的解析器认为它们同样重要

我猜他们(可能还有其他人)会查看dom结构,并找到与看起来“可共享”的内容相近的图像

更新:


经过一些实证检验,图像维度似乎起到了很大的作用。太小和太宽的图像不被视为缩略图。如果你的logo大小合适,希望它显示为一个缩略图。例如,试着分享一些东西。

他们并不总能捕捉到正确的图像,尽管肯定有一些好的逻辑

在很多情况下,我看到了一个可供选择的缩略图列表,这意味着Facebook的解析器认为它们同样重要

我猜他们(可能还有其他人)会查看dom结构,并找到与看起来“可共享”的内容相近的图像

更新:


经过一些实证检验,图像维度似乎起到了很大的作用。太小和太宽的图像不被视为缩略图。如果你的logo大小合适,希望它显示为一个缩略图。例如,试着在网上分享一些东西。

事实上,Facebook查找缩略图的方式并没有那么神奇。它搜索一组指定要使用的标题、说明和图像的
标记

如果它找不到它要查找的
标记,它基本上会要求用户选择哪个

资料来源:


事实上,Facebook查找缩略图的方式并没有那么神奇。它搜索一组指定要使用的标题、说明和图像的
标记

如果它找不到它要查找的
标记,它基本上会要求用户选择哪个

资料来源:


这只是猜测,因为我对脸谱网的内部操作一无所知,但是如果我从页面中解析缩略图,我会考虑以下几点:

  • 图像的大小,如前所述
  • href
    alt
    属性中的相关关键字
  • 标签在页面上的位置越靠近相关内容越好,但对于复杂的布局可能并不总是有效
  • 标签或附近的标签中缺少与广告相关的关键字(想到双击)

另外,据我所知,Facebook元标签是相当新的,所以我猜链接页面刮板仍然在艰难地抓取图像;)但是,如果你正在运行一个站点,并且希望脸谱网在你的页面上抓取正确的信息,我强烈建议你去实现它们。

< P>这只是猜测,因为我对脸谱网的内部操作一无所知,但是如果我从页面中解析缩略图,我会考虑几件事:

  • 图像的大小,如前所述
  • href
    alt
    属性中的相关关键字
  • 标签在页面上的位置越靠近相关内容越好,但对于复杂的布局可能并不总是有效
  • 标签或附近的标签中缺少与广告相关的关键字(想到双击)

另外,据我所知,Facebook元标签是相当新的,所以我猜链接页面刮板仍然在艰难地抓取图像;)但是,如果你正在运行一个网站,并且希望Facebook在抓取你的页面时获取正确的信息,我强烈建议你实施这些操作。

没错,但例如,我发现tomshardware的一篇文章:它最初会抓取正确的缩略图,页面上没有元标记或其他指示符。@特拉维斯:哪个
标记更接近页面上最大的文本块。。。或者哪个
标记占用了最多的空间。它在某些页面上猜对了,但在另一些页面上猜对了,现在很有意义,感谢Andrew的帮助。@AndrewMoore它不是猜对了,而是寻找opengraph元标记@马基亚托:是的,我的回答已经说过了。但是,如果元标记或链接标记不存在,他们会猜测。对,但例如,我发现tomshardware的一篇文章:它最初在页面上没有元标记或其他指示符的情况下,在右缩略图上拍照。@Travis:Which
标记更接近页面上最大的文本块。。。或者哪个
标记占用了最多的空间。它在某些页面上猜对了,但在另一些页面上猜对了,现在很有意义,感谢Andrew的帮助。@AndrewMoore它不是猜对了,而是寻找opengraph元标记@马基亚托:是的,我的回答已经说过了。但是,如果元标记或链接标记不存在,则它们会猜测。的可能重复
<meta name="thumbnail" content="whatever.jpg" />
<meta name="title" content="title" />
<meta name="description" content="description " />
<link rel="image_src" href="thumbnail_image" />