Scripting 搜索引擎可以索引由服务器端代码生成的页面吗?

Scripting 搜索引擎可以索引由服务器端代码生成的页面吗?,scripting,search-engine,server-side,Scripting,Search Engine,Server Side,我猜像stack overflow这样的网站不会为每个问题保留一个html文件。相反,服务器端代码会在每次单击问题时创建页面(我认为)。搜索引擎是否有可能在堆栈溢出上为每个问题编制索引,或者是否需要在目录中保留每个问题的一页,以便搜索引擎可以对其进行爬网?是的,这是完全可能的-当跟踪链接时,服务器会像任何其他网页一样返回HTML。唯一的区别是,它是由服务器生成的,而不是由一个人生成的。是的,这是完全可能的-当链接被跟踪时,服务器返回的HTML与任何其他网页一样。唯一的区别是服务器生成了它,而不是

我猜像stack overflow这样的网站不会为每个问题保留一个html文件。相反,服务器端代码会在每次单击问题时创建页面(我认为)。搜索引擎是否有可能在堆栈溢出上为每个问题编制索引,或者是否需要在目录中保留每个问题的一页,以便搜索引擎可以对其进行爬网?

是的,这是完全可能的-当跟踪链接时,服务器会像任何其他网页一样返回HTML。唯一的区别是,它是由服务器生成的,而不是由一个人生成的。

是的,这是完全可能的-当链接被跟踪时,服务器返回的HTML与任何其他网页一样。唯一的区别是服务器生成了它,而不是一个人。

是。搜索引擎可以索引动态生成的网页没有问题。事实上,从搜索引擎机器人的角度来看,它甚至不能真正区分动态生成的页面和静态页面。

是的。搜索引擎可以索引动态生成的网页没有问题。事实上,从搜索引擎机器人的角度来看,它甚至不能真正区分动态生成的页面和静态页面。

就客户端(无论是浏览器还是搜索引擎)而言,服务器生成的页面和静态文件之间没有区别。它们几乎无法区分(取决于页面的生成方式,它可能缺少上次修改的
标题等)。因此,是的,搜索引擎可以毫无问题地为生成的页面编制索引

也就是说,给他们一个暗示是有道理的。例如,使用,给搜索引擎一个很好的你所有页面的列表,所以它不太可能错过它们。更重要的是,它可以总结上次修改的时间,将搜索引擎的注意力集中在最近发生的变化上。这不是强制性的,但它确实有帮助-无论页面是静态HTML还是生成的。

对于客户端(无论是浏览器还是搜索引擎),服务器生成的页面和静态文件之间没有区别。它们几乎无法区分(取决于页面的生成方式,它可能缺少上次修改的
标题等)。因此,是的,搜索引擎可以毫无问题地为生成的页面编制索引


也就是说,给他们一个暗示是有道理的。例如,使用,给搜索引擎一个很好的你所有页面的列表,所以它不太可能错过它们。更重要的是,它可以总结上次修改的时间,将搜索引擎的注意力集中在最近发生的变化上。这不是强制性的,但它确实有帮助-无论页面是静态HTML还是生成的。

大多数爬虫都可以跟随使用GET的任何链接。任何需要帖子的内容通常都会被忽略


生成页面的机制是不相关的。

任何使用GET的链接都可以被大多数爬虫跟踪。任何需要帖子的内容通常都会被忽略


生成页面的机制是不相关的。

如果这不受robot.txt或元标记的限制,则是。搜索引擎像普通用户一样请求网页,没有人可以访问服务器端代码(如果您的网站没有被黑客入侵))

如果这不受robot.txt或元标记的限制,则是。搜索引擎像普通用户一样请求网页,没有人可以访问服务器端代码(如果您的网站没有被黑客入侵))

搜索引擎可以在给定的网页上看到几乎任何不隐藏在客户端代码(即JavaScript)后面的内容

因此,如果您可以在浏览器的地址栏中输入一个URL来获取此页面,并且此页面是从某个地方链接到的,那么搜索引擎将找到它并“查看”与您相同的内容。页面是由服务器动态生成的这一事实与搜索引擎无关,因为请求URL时发送到浏览器的内容仍然只是HTML文件


换句话说,该HTML文件在服务器上并不以相同的形式存在-也就是说,它实际上是生成HTML的服务器端代码,而不是静态HTML文件-但这不是搜索引擎爬行和索引的内容,搜索引擎可以在给定的网页上看到几乎任何不隐藏在客户端代码(即JavaScript)后面的内容

因此,如果您可以在浏览器的地址栏中输入一个URL来获取此页面,并且此页面是从某个地方链接到的,那么搜索引擎将找到它并“查看”与您相同的内容。页面是由服务器动态生成的这一事实与搜索引擎无关,因为请求URL时发送到浏览器的内容仍然只是HTML文件


换句话说,该HTML文件在服务器上并不以相同的形式存在-也就是说,它实际上是生成HTML的服务器端代码,而不是静态HTML文件-但这不是搜索引擎爬行和索引的内容,您可能会对Google网站管理员官方中心博客上的帖子感兴趣。

您可能会对Google网站管理员官方中心博客上的帖子感兴趣