Indexing 谷歌404软错误的索引页,这是正常工作

Indexing 谷歌404软错误的索引页,这是正常工作,indexing,http-status-code-404,google-search,google-webmaster-tools,google-search-console,Indexing,Http Status Code 404,Google Search,Google Webmaster Tools,Google Search Console,我的一个朋友在谷歌为她的网站编制索引时遇到了麻烦,她让我看一看,但这并不是我真正了解的事情,我希望得到一些帮助 查看她的搜索控制台,谷歌爬网在索引页上显示了一个soft-404错误。我多次将此标记为已修复,因为该站点在我看来很好,但它会不断恢复 如果我以谷歌的方式获取该网站,它似乎运行良好,尽管它显示的是移动版而不是桌面版 它不断重复出现404页面,这在我能看到的任何地方都不存在,包括服务器文件或网站地图 以下是我对该网站的了解: 它曾经是一个wix站点,2-3个月前被移动到主机gator共享

我的一个朋友在谷歌为她的网站编制索引时遇到了麻烦,她让我看一看,但这并不是我真正了解的事情,我希望得到一些帮助

查看她的搜索控制台,谷歌爬网在索引页上显示了一个soft-404错误。我多次将此标记为已修复,因为该站点在我看来很好,但它会不断恢复

如果我以谷歌的方式获取该网站,它似乎运行良好,尽管它显示的是移动版而不是桌面版

它不断重复出现404页面,这在我能看到的任何地方都不存在,包括服务器文件或网站地图

以下是我对该网站的了解:

它曾经是一个wix站点,2-3个月前被移动到主机gator共享服务器

它使用JavaScript/jQuery.load获取index.html模板之外的页面内容

它有两个站点地图,一个用于URL,另一个用于URL和图像

自从提交索引以来已经有2个月了,当你搜索网站www.smeyan.com时,谷歌还没有为任何内容编制索引。它显示了一些来自wix服务器的旧内容。尽管搜索控制台说它已经索引了172张图片

它在搜索控制台中将www.设置为首选项


有没有人经历过这种情况并有解决问题的方向

在缓存控制标头中为此站点设置了多长时间?如果很长,您应该对过时的代码段和缓存使用“google removals”。我在你的网页上模拟了谷歌访问。正确的404返回码。正确的标题。因此报告“未找到”页面的谷歌删除。你必须请求谷歌机器人的访问,保持冷静,等待反应

顺便说一句:对于永久删除的内容,请使用410 Gone For Google或。。。通过删除报告。

我在使用Chrome的Inspect功能时看到的唯一下载错误与一个脚本标记有关,该脚本标记的源(src)文件为Facebook url

这是Inspect报告的错误。

这是导致错误的脚本标记。


我不确定这是否是404错误再次发生的原因,但这是本网站需要注意的一个问题。

我使用Tor Browser检查了您的网站,它已。。。禁用的脚本。您应该使用
标签提供站点上的任何内容。它不一定要漂亮,但应该对机器人可见<代码>,和索引

如果没有脚本,菜单也无法工作

我认为这一步实施得很好

请使用
元素并为盲人(无脚本,为图像提供
alt
标记)和noscript浏览器实现版本。您可以通过禁用脚本或通过Firefox的NOSCRIPT扩展来测试它


顺便说一句,你应该使用HTML,CSS(包括动画)和。。。仅在需要时使用JS。或者<代码>方法

googlebot目前使用基于旧chrome41(M41)的web呈现服务(WRS),因此如果浏览器成功,它可能会失败

要了解GoogleBoot的工作原理,请阅读

向页面添加代码以查看真正的错误。 您可以使用Url Inspector live从中查看错误。它将显示在
更多信息
选项卡上


注意:如果bot获得301代码,或者如果页面太小而没有重要内容,它将返回一个软404错误,并且不会预览或显示任何其他错误。

只是猜测-这是否与使用js渲染相关?它以前也是通过javascript呈现的吗?相关文章一些快速猜测-这可能是一个爬网预算问题,因为Wix站点可能会很慢(当Google尝试爬网站点时,实际上是一个“超时”)。或者,这可能是一个重定向问题——如果你使用Fiddler或Postman请求该站点,会返回什么确切的http响应?谷歌没有索引任何要删除的页面。自从该网站第一次被要求建立索引以来,已经有3个多月的时间了。搜索控制台爬网率显示每天有3-4个页面被爬网。如果谷歌已经从WIX移动,谷歌可以检测到重复的内容。重复的内容通常会被过滤。你能在WIX上发送到你的内容的链接吗?WIX当前已解除索引?另外:请阅读我的第二个答案。搜索引擎优化问题。这是一个需要改进的问题,但是。。。许多404链接已断开的页面都已正确索引。问题可能是内容重复。谷歌现在不能显示内容,但部分谷歌服务器仍然可以保存。也可以使用W3C验证程序。您在HTML中有错误。还可以在jigsaw验证器上检查CSS。