Sitemap 在站点地图中,是否建议包含指向站点上每个页面的链接,还是只包含需要链接的页面?

Sitemap 在站点地图中,是否建议包含指向站点上每个页面的链接,还是只包含需要链接的页面?,sitemap,Sitemap,我正在为我的网站创建网站地图。我这样做是因为我有大量的页面,用户通常只能通过搜索表单访问这些页面 我已经创建了一种自动方法,用于从数据库中提取链接并将其编译成站点地图。但是,对于所有定期访问且不在数据库中的页面,我必须手动浏览并将其添加到站点地图中 我突然意识到,常规页面是那些被普通爬虫找到的页面,因此手动添加这些页面,然后确保站点地图保持对它们的任何更改的最新信息似乎是一件麻烦事 如果它们已经被编入索引,而我的站点地图只包含我的动态页面,那么将它们删除是不是一件坏事?是的,我认为将它们删除不是

我正在为我的网站创建网站地图。我这样做是因为我有大量的页面,用户通常只能通过搜索表单访问这些页面

我已经创建了一种自动方法,用于从数据库中提取链接并将其编译成站点地图。但是,对于所有定期访问且不在数据库中的页面,我必须手动浏览并将其添加到站点地图中

我突然意识到,常规页面是那些被普通爬虫找到的页面,因此手动添加这些页面,然后确保站点地图保持对它们的任何更改的最新信息似乎是一件麻烦事


如果它们已经被编入索引,而我的站点地图只包含我的动态页面,那么将它们删除是不是一件坏事?

是的,我认为将它们删除不是一件好事。我认为也应该寻找一种方法,让你的搜索页面可以被一个没有网站地图的爬虫找到。例如,您可以添加某种高级搜索页面,用户可以在其中的表单中选择搜索词。爬虫程序也可以填写这些表单。

谷歌将对它发现的任何URL(robots.txt允许的)进行爬虫,即使它们不在网站地图中。只要静态页面都可以从站点地图中的其他页面访问,就可以将它们排除在外。但是,站点地图XML还有其他一些特性可能会激励您在站点地图中包含静态URL(例如修改日期和优先级)


如果您愿意编写一个脚本来自动为数据库条目生成站点地图,那么再进一步,让您的脚本也为静态页面生成条目。这可能很简单,只需搜索webroot并查找*.html文件。或者,如果您正在使用一个框架,请迭代框架的静态路径。

假设您有一个搜索表单,有一个关于苹果的页面和一个关于猴子的页面。在我看来,爬虫不会在苹果和猴子以及每一个术语中输入,以确保它们能获得你的每一页。你剩下的答案很好,但事实上这是不正确的。