Google analytics 爬虫架构:避免在谷歌分析中计算请求

Google analytics 爬虫架构:避免在谷歌分析中计算请求,google-analytics,web-crawler,google-tag-manager,Google Analytics,Web Crawler,Google Tag Manager,我们运行一项服务,需要时不时为客户的网站编制索引。我们的一位客户刚刚注意到,我们的机器人的流量可以在他们的分析中看到(他们使用谷歌标签管理器)。当然,他们可以尝试过滤它,但我想知道为什么它会被跟踪,因为我们没有在机器人中启用JS,而且他们已经勾选了“排除已知机器人和蜘蛛的流量”。两个问题: 从我们这边(机器人),我们能做些什么来告诉谷歌分析不计入流量吗 如果没有,他们如何过滤掉我们的机器人?我们已经设置了一个用户代理,但它似乎在谷歌分析中不可用——我们的IP也不可用 我在想,如果有谷歌标签管理器

我们运行一项服务,需要时不时为客户的网站编制索引。我们的一位客户刚刚注意到,我们的机器人的流量可以在他们的分析中看到(他们使用谷歌标签管理器)。当然,他们可以尝试过滤它,但我想知道为什么它会被跟踪,因为我们没有在机器人中启用JS,而且他们已经勾选了“排除已知机器人和蜘蛛的流量”。两个问题:

  • 从我们这边(机器人),我们能做些什么来告诉谷歌分析不计入流量吗
  • 如果没有,他们如何过滤掉我们的机器人?我们已经设置了一个用户代理,但它似乎在谷歌分析中不可用——我们的IP也不可用

  • 我在想,如果有谷歌标签管理器,而你已经禁用了JS,为什么要跟踪它

    没有JS 结果似乎是通过iframe包含的tagmaneger的noscript变体

    <noscript><iframe src="//www.googletagmanager.com/ns.html?id=GTM-XXXX"
    height="0" width="0" style="display:none;visibility:hidden"></iframe></noscript>
    

    自定义筛选器中既有IP筛选器,也有浏览器筛选器-您必须为每个视图设置它们(Admin/view/filters/custom/Exclude=>字段名eq IP address)。如果启用了IP匿名,则需要排除整个IP块,因为最后3位数字未存储,无法用于精确匹配。
    window['ga-disable-UA-XXXX-Y'] = true;