Facebook graph api 什么';s Facebook的IP地址范围';什么是开放图爬虫?

Facebook graph api 什么';s Facebook的IP地址范围';什么是开放图爬虫?,facebook-graph-api,Facebook Graph Api,为了在我们的预览环境中测试OpenGraphAPI,我们需要在防火墙上戳一个洞,让Facebook刮取我们的对象页面。我们应该允许哪些IP范围?编辑 Facebook一直表现出一些爱心,现在正将IP区块公开给任何人 Facebook刮板 许多平台服务,如社交插件和开放 Graph要求我们的系统能够访问您的网页。我们 认识到有些情况下你可能不想要这些 在测试期间或其他安全性方面,公共互联网上的页面 原因 为了促进这一点,您应该在安全性中设置例外 允许Facebook通过添加 以下IP范围,截至

为了在我们的预览环境中测试OpenGraphAPI,我们需要在防火墙上戳一个洞,让Facebook刮取我们的对象页面。我们应该允许哪些IP范围?

编辑

Facebook一直表现出一些爱心,现在正将IP区块公开给任何人

Facebook刮板

许多平台服务,如社交插件和开放 Graph要求我们的系统能够访问您的网页。我们 认识到有些情况下你可能不想要这些 在测试期间或其他安全性方面,公共互联网上的页面 原因

为了促进这一点,您应该在安全性中设置例外 允许Facebook通过添加 以下IP范围,截至2012年4月准确

31.13.24.0/21
31.13.64.0/18
66.220.144.0/20
69.63.176.0/20
69.171.224.0/19
74.119.76.0/22
103.4.96.0/22
173.252.64.0/18
204.15.20.0/22

除了IP,您还可以使用防火墙的用户代理

Facebook什么时候刮我的页面?

Facebook需要刮掉你的页面,才能知道如何显示它 网站

Facebook每24小时会清理一次你的页面,以确保这些属性是安全的 最新的当管理员打开图形时,该页面也会被刮除 页面单击Like按钮,当URL输入到 Facebook的URL Linter。Facebook观察你的URL上的缓存头-它 将按优先顺序查看“过期”和“缓存控制”。 然而,即使你指定更长的时间,Facebook也会刮伤你的脸 每24小时翻页一次

scraper的用户代理是:“facebookexternalhit/1.1 (+)”


Facebook没有正式发布其爬虫源地址范围,但您可以在公开可用的BGP路由表中查看其所有IP范围的列表:

我们目前正在使用以下列表:

  • 69.171.224.0/19
  • 74.119.76.0/22
  • 204.15.20.0/22
  • 66.220.144.0/20
  • 69.63.176.0/20
  • 173.252.64.0/18
      • 66.220.144.0/20

      • 66.220.144.0/21

      • 66.220.152.0/21
      • 66.220.159.0/24
      • 69.63.176.0/20

      • 69.63.176.0/21

      • 69.63.176.0/24

      • 69.63.184.0/21

      • 69.171.224.0/19

      • 69.171.224.0/20
      • 69.171.239.0/24
      • 69.171.240.0/20
      • 69.171.255.0/24
      • 74.119.76.0/22
      • 103.4.96.0/22
      • 173.252.64.0/18
      • 173.252.64.0/19
      • 173.252.70.0/24
      • 173.252.96.0/19
      • 204.15.20.0/22

      • 31.13.24.0/21

      • 31.13.64.0/18
      • 31.13.64.0/19
      • 31.13.64.0/24
      • 31.13.65.0/24
      • 31.13.66.0/24
      • 31.13.67.0/24
      • 31.13.68.0/24
      • 31.13.69.0/24
      • 31.13.70.0/24
      • 31.13.71.0/24
      • 31.13.72.0/24
      • 31.13.73.0/24
      • 31.13.74.0/24
      • 31.13.75.0/24
      • 31.13.76.0/24
      • 31.13.77.0/24
      • 31.13.96.0/19

        • Facebook现在发布他们的

          截至2012年4月,为:

          31.13.24.0/21
          31.13.64.0/18
          66.220.144.0/20
          69.63.176.0/20
          69.171.224.0/19
          74.119.76.0/22
          103.4.96.0/22
          173.252.64.0/18
          204.15.20.0/22
          

          whois-h whois.radb.net--'-i origin AS32934'| grep^route
          查看所有范围。

          以下URL上列出了新信息&是的,他们确实公开了此信息

          运行此命令以获取爬虫程序的当前IP地址列表 使用

          比如

          # For example only - over 100 in total
          31.13.24.0/21 
          66.220.144.0/20    
          2401:db00::/32  
          2620:0:1c00::/40  
          2a03:2880::/32 
          
          所以是的,DMCS提到的,站对了。只是想验证并找到此信息


          谢谢

          你能具体说明你从哪里得到这些数据吗?这些是Facebook在互联网上发布的广告路线,并且是准确的发帖日期。FB并不热衷于将永久的静态地址分配给像这样的外部vip,客户通常只需要允许他们的所有地址空间,以确保如果/当他们从ipv4地址池中添加新vip时,他们可以连接到它。这当然意味着,如果facebook开始宣传新的ipv4空间,该列表将过时。facebook刚刚发布了一些相关信息。我已将其添加到我的回复中。+1!仅供参考,“IP范围”方法更优越;“用户代理”方法不会覆盖所有的Facebook搜索引擎。从技术上讲,它可能会捕获所有“开放图爬虫”,但Facebook有更多使用不可区分的用户代理的爬虫。(来源:我们的日志)这里有更多的信息。另外,请注意,这种方法实际上是有效的。
          # For example only - over 100 in total
          31.13.24.0/21 
          66.220.144.0/20    
          2401:db00::/32  
          2620:0:1c00::/40  
          2a03:2880::/32