Google analytics 如何排除可能包含Googlebot的奇怪Google分析数据?

Google analytics 如何排除可能包含Googlebot的奇怪Google分析数据?,google-analytics,googlebot,Google Analytics,Googlebot,我们是一家天然食品连锁店,位于华盛顿州西雅图。我们的门店位置页面是我们网站上浏览量最大的页面之一,包括作为门店定位器的,您可以在其中输入邮政编码以查找最近的门店 从2015年2月3日(星期二)的统计数据开始,我开始看到可疑行为在2月6日(星期五)达到高峰,今天继续出现,似乎只影响了我们的www.hostname和m.com的商店定位页面。主机名。具体地说,我观察到来源是直接的视图数量异常多。对于绝大多数这些直接视图,许多标准尺寸(如浏览器、操作系统、区域等)的值未设置。到目前为止,已经有近280

我们是一家天然食品连锁店,位于华盛顿州西雅图。我们的门店位置页面是我们网站上浏览量最大的页面之一,包括作为门店定位器的,您可以在其中输入邮政编码以查找最近的门店

从2015年2月3日(星期二)的统计数据开始,我开始看到可疑行为在2月6日(星期五)达到高峰,今天继续出现,似乎只影响了我们的www.hostname和m.com的商店定位页面。主机名。具体地说,我观察到来源是直接的视图数量异常多。对于绝大多数这些直接视图,许多标准尺寸(如浏览器、操作系统、区域等)的值未设置。到目前为止,已经有近2800个页面浏览量符合这一标准,其中约260个是唯一的

当我查看Apache访问日志时,我发现没有足够多的请求用于相关页面——即使我包括了用户代理被标识为Googlebot、bingbot或Yahoo!咕噜咕噜

到目前为止,这些异常与没有任何查询参数的页面有关。然而,在我回顾的过程中,我发现了另一个谜团,也是从2月3日开始的。有很多请求的邮政编码查询参数设置为我们市场区域以外的邮政编码。同样,标准尺寸记录为未设置。这一次,当我查看服务器日志时,我确实发现了相同数量的请求,但令人惊讶的是,大多数请求来自谷歌机器人!我的第一个想法是有人在欺骗Googlebot,但通过遵循Google记录的验证步骤,这些似乎是合法的

例如,在2月6日,服务器日志中有两个请求/locations/index.php?zip=66758&radius=5这是KS Neosho Falls的zip。两者的用户代理都被记录为与Mozilla/5.0兼容;谷歌机器人/2.1;+。一个请求来自66.249.67.61,另一个来自66.249.67.77

host 66.249.67.77
77.67.249.66.in-addr.arpa domain name pointer crawl-66-249-67-77.googlebot.com.

host crawl-66-249-67-77.googlebot.com
crawl-66-249-67-77.googlebot.com has address 66.249.67.77

host 66.249.67.61
61.67.249.66.in-addr.arpa domain name pointer crawl-66-249-67-61.googlebot.com.

host crawl-66-249-67-61.googlebot.com
crawl-66-249-67-61.googlebot.com has address 66.249.67.61
在Google Analytics中,有2个页面同时显示1个独特的视图

同样奇怪的是,所有这些基于邮政编码的请求报告的入口数量为零。后来我发现,这些基于邮政编码的请求通常是上述可疑页面视图的登录页,没有查询参数

2月6日,Google Analytics中总共只有472个邮政编码请求,但该服务器以Googlebot作为用户代理记录了近2000个邮政编码请求。机器人似乎正在运行一长串的邮政编码

我一直在想,由于谷歌机器人的活动应该被排除在谷歌分析报告之外,我显然遗漏了一些东西。我已经访问了谷歌分析产品论坛,还没有回复

我还要补充一点,我们使用的是追踪代码的经典版本,最近还没有编辑过