Ajax 为什么Facebook解析Twitter URL不正确?
我在挠头 以(新的)推特url为例[http://twitter.com/#!/NASA](注意“#!”) 将此链接粘贴到你的Facebook墙上或Facebook主页上的“你在想什么?”输入框中 在它抓取链接之后,看看它解析为什么链接。这不是正确的twitter url。昨晚它决定[http://twitter.com/#!/d3nidhint]现在,它决定[http://twitter.com/#!/hKnbln](前者解析为twitter页面,后者不解析)。有什么好处 Facebook很清楚地解析了这个url,并将其解析为不同的内容。如果它能做到这一点,它应该将url解析到适当的twitter页面。我在网上搜索,找到了建议对这些AJAX URL进行爬网的Google链接,但与这种奇怪的反常现象无关:[http://code.google.com/web/ajaxcrawling/]及[http://googlewebmastercentral.blogspot.com/2009/10/proposal-for-making-ajax-crawlable.html]Ajax 为什么Facebook解析Twitter URL不正确?,ajax,facebook,url,twitter,web-crawler,Ajax,Facebook,Url,Twitter,Web Crawler,我在挠头 以(新的)推特url为例[http://twitter.com/#!/NASA](注意“#!”) 将此链接粘贴到你的Facebook墙上或Facebook主页上的“你在想什么?”输入框中 在它抓取链接之后,看看它解析为什么链接。这不是正确的twitter url。昨晚它决定[http://twitter.com/#!/d3nidhint]现在,它决定[http://twitter.com/#!/hKnbln](前者解析为twitter页面,后者不解析)。有什么好处 Facebook很清
想法?发生这种情况的原因是Twitter将其永久链接(如http://Twitter.com/RWW)切换到http://Twitter.com/#/RWW和Facebook爬虫认为这只是对同一页面http://twitter.com/的更新,所以你可以得到最后缓存的内容。他们需要更新他们的爬虫程序来替换#!出来如果这是所有使用ajax导航的人的标准实践,那就太好了 ps-添加了空间,因为堆栈溢出认为我的所有链接都是垃圾邮件-LOL