Facebook对象调试器在尝试刮取时返回404未找到

Facebook对象调试器在尝试刮取时返回404未找到,facebook,facebook-opengraph,Facebook,Facebook Opengraph,我有一个简单的Tumblr网站博客,我在上面发布内容 但是,自从我更改了DNS后,Facebook对象调试器会看到我的根url的非常旧的数据:对于每个帖子(例如:),它会显示一个404未找到,这是胡说,因为实际内容在那里 完整的错误消息:解析输入URL时出错,未缓存任何数据,或未刮取任何数据。 我尝试了以下方法来修复它: 清除浏览器缓存/cookies/历史记录 在URL后使用?fbresh=1(不起作用) 我已经在页面中添加了一个FB应用程序id(确保该应用程序已投入生产-添加了正确的名称空

我有一个简单的Tumblr网站博客,我在上面发布内容

但是,自从我更改了DNS后,Facebook对象调试器会看到我的根url的非常旧的数据:对于每个帖子(例如:),它会显示一个
404未找到
,这是胡说,因为实际内容在那里

完整的错误消息:
解析输入URL时出错,未缓存任何数据,或未刮取任何数据。

我尝试了以下方法来修复它:

  • 清除浏览器缓存/cookies/历史记录
  • 在URL后使用
    ?fbresh=1
    (不起作用)
  • 我已经在页面中添加了一个FB应用程序id(确保该应用程序已投入生产-添加了正确的名称空间等-也没有更改任何内容)
  • 查看有关此主题的其他问题
  • 重新检查了我所有的元标记十几次
还有哪些其他选项可以解决此问题? 如果您需要更多信息,请在评论中询问

2014-09-08-更新

将我的url放入静态调试器时。firebug的“net”选项卡给出以下响应:

 <meta http-equiv="refresh" content="0; URL=/tools/debug/og/echo?q=http%3A%2F%2Fwww.kofferbaque.nl%2F&amp;_fb_noscript=1" /><meta http-equiv="X-Frame-Options" content="DENY" />

2014-09-11-更新

  • 已删除重复的
    声明
  • 清理
    开始标记(aka-暂时删除IE支持)
我在博客上贴了一篇测试文章,看看它是否有效,但没有。不知何故,我的根url开始“神奇地”自我更新。或者说,它删除了旧数据——可能是因为我删除了它仍然引用的旧应用程序。但是,它仍然无法正确地看到“更新的”标记

还是没有成功

2014-09-12-更新

完成:

  • 标记移动到
    元素的顶部
  • 从页面+正文脚本中删除了
    fb:app_id
    ,因为它没有任何用途
这看起来没有任何变化。tumblr似乎还在head元素的开头注入了很多脚本标记。也许这就是Facebook刮板没有“看到”元标签的原因


令人沮丧的是,通过其他一些og标签扫描仪,它显示了所有正确的信息

首先,HTML无效。您获得了两次doctype(至少在post页面上),并且在html标记(脚本标记和IE条件)之前有内容

这可能是问题所在,但请确保将og标记放在head部分的开头-调试器只读取页面的一部分afaik,因此请确保og标记位于该部分。将所有其他og标记放在“og:site\u name”后面


顺便说一句:
?fbresh=1
并不是必须的,您可以使用任何参数-只是为了创建不同的url。但是调试器提供了一个刷新抓取的按钮,所以无论如何它都是无用的。

我删除了我的“不是很有用”的答案,但是如果FB得到404,那么可能是关于服务器(Apache/nginx)配置的问题。尝试记录Facebook发送的请求(所有数据、标题等),并研究服务器返回“未找到”的原因。404是一个http响应代码,因此它与DNS无关-请求实际上到达了服务器。你能在html之前删除脚本标记吗?这将帮助我们调试。@Gerard Westerhof你的主页为我工作。你能发布你的重写规则吗?确保你没有阻止facebook爬虫。我不掌握重写规则。由于域名只是指向一个“tumblr”网站。可能重复感谢您的帮助!我对HTML做了一些更改。但是我猜刮刀必须重新访问我的页面;var翻译为警告字符串='Waarschuwing:voer……。我知道。这里讨论的问题是:“我们有同样的问题,facebook没有共享url”-确切地说,这是有意义的,因为它是无效的html。但我不知道如何摆脱它。tumblr是一个相当封闭的系统,对吧?这根本不重要,因为在我将域名指向tumblr博客之前,facebook共享了这个url。我假设
script
标签也在那里。