Php AJAX爬网(hashbang转换)

Php AJAX爬网(hashbang转换),php,ajax,seo,googlebot,hashbang,Php,Ajax,Seo,Googlebot,Hashbang,我正在开发ajaxcrawlable()网站,但有些事情我还不清楚。在应用程序的后端,我过滤掉\u escaped\u fragment\u参数,并按预期返回HTML快照 如下图所示手动调用URL时,没有问题: (1) 动物!狗 (2) 动物?\u逃跑\u碎片\u=狗 在选项(1)处查看页面源时,动态加载内容,并且使用选项(2)页面源包含html快照。到目前为止还不错 问题是,当使用建议的googlefetch()时,爬行器看起来只是爬行选项(1),就好像hashbang(#!)永远不会被AJA

我正在开发ajaxcrawlable()网站,但有些事情我还不清楚。在应用程序的后端,我过滤掉
\u escaped\u fragment\u
参数,并按预期返回HTML快照

如下图所示手动调用URL时,没有问题:

(1) 动物!狗

(2) 动物?\u逃跑\u碎片\u=狗

在选项(1)处查看页面源时,动态加载内容,并且使用选项(2)页面源包含html快照。到目前为止还不错

问题是,当使用建议的googlefetch()时,爬行器看起来只是爬行选项(1),就好像hashbang(#!)永远不会被AJAX爬行器转换一样。即使在处理
\u转义片段的函数内部硬编码
死亡(“AJAX测试”)
时,这也不会反映在爬行器生成的结果中

到目前为止,我所做的一切都是按照谷歌的指导方针进行的,我唯一能解决这个问题的线索是在谷歌论坛的一个子页面上找到的:。如果是这样的话,那就意味着没有准确的方法来测试谷歌机器人会看到什么,直到这些更改生效并且页面被重新索引

其他页面,比如谷歌页面本身,建议可以使用谷歌Fetch进行测试


这些信息似乎自相矛盾,我不知道我的AJAX内容是否会被谷歌机器人正确抓取。希望有更多这方面的知识的人能帮助我。

哈希刘海已经被放弃了。这是更友好的选择。

请让Hangbags在火灾中死去。它们是一种可怕的黑客行为,而且是h已经被取代了。@Quentin我同意。你应该像Quentin说的那样阅读
window.history