Google analytics 如何破解谷歌gclids

Google analytics 如何破解谷歌gclids,google-analytics,statistics,analytics,protocol-buffers,google-ads-api,Google Analytics,Statistics,Analytics,Protocol Buffers,Google Ads Api,现在,我意识到对此的最初反应可能是“你不能”或“使用分析”,但我会继续,希望有人有更多的洞察力 带有“自动标记”的Google adwords附加了一个“gclid”(大概是“Google click id”)链接,将您发送到广告站点。它出现在web日志中,因为它是一个查询参数,分析人员使用它将访问与广告/活动联系起来 我想做的是从gclid中提取任何有用的信息,以便对我们的流量进行我们自己的分析。原因如下: 统计数据是不完美的,但如果我们整理它们,我们就确切地知道我们做出了什么样的假设,以及

现在,我意识到对此的最初反应可能是“你不能”或“使用分析”,但我会继续,希望有人有更多的洞察力

带有“自动标记”的Google adwords附加了一个“gclid”(大概是“Google click id”)链接,将您发送到广告站点。它出现在web日志中,因为它是一个查询参数,分析人员使用它将访问与广告/活动联系起来

我想做的是从gclid中提取任何有用的信息,以便对我们的流量进行我们自己的分析。原因如下:

  • 统计数据是不完美的,但如果我们整理它们,我们就确切地知道我们做出了什么样的假设,以及它们是如何计算的
  • 我们可以将这些数据与其他数据联系起来,并生成更准确的统计数据wrt转换率
  • 我们不必依赖javascript进行转换
现在很明显,gclid是base64编码的(或一些相近的变体),它的某些部分比其他部分变化更大。除此之外,我还无法确定它与什么有关

是否有人对我如何破解这一问题有任何见解,或者是否有人已经将gclids与compaigns甚至帐户联系起来


我和谷歌的几个人谈过,尽管他们的座右铭是“不要作恶”,但他们完全不愿意讨论泄露这些信息的可能性,即使是在保密协议下。他们似乎喜欢垄断我们的网络统计数据。

好吧,这不是答案,但这种方法与解决任何加密问题的方法类似

可能性1:它们只是随机的,在这种情况下,你就完蛋了。这类似于一次性pad

可能性2:它们“意味着”什么。在这种情况下,你必须控制环境

  • 得到一个很好的数据库。为您的站点和其他站点查找gclids。记录所有单击发生的所有时间,以及任何其他可能有用的数据
  • 快点!正如您已经开始的那样,开始将收集的数据与已知数据进行回归,看看是否可以找到使用解密技术的模式
  • 开始清理随机的gclid,看看他们会带你去哪里
    虽然我对这次成功不抱太大希望,但我真的祝你好运

    到目前为止,最简单的解决方案是使用Google Analytics活动跟踪参数(utm_来源、utm_活动、utm_媒介等)手动标记链接,然后取出该数据

    gclid不仅仅依赖于adwords帐户/活动等。如果你点击同一个adwords广告两次,它可能会给你不同的gclid,因为还有各种各样的会话和成本数据与特定的点击相关

    Gclid可能不是100%随机的,没错,但如果能够从这个数字中提取所有Adwords数据,我会非常惊讶和担心。这将是一个巨大的安全漏洞(即任意用户可以查看您的Adwords数据)。更有可能的是,每个印象都会生成一个伪随机的gclid,如果点击了该广告,gclid就会登录到Adwords中(否则就会被抛出)。然后,Analytics使用该数字在事后将数据与Adwords进行核对。除此之外,gclid数字本身没有内在价值

    关于你的最后一点,谷歌分析和谷歌广告词服务条款都明确禁止试图破解或反向工程这些信息,这是永久禁止的理由。此外,您在注册这些服务时同意的TOS表示,您不能以任何方式使用这些数据。谷歌提供免费服务,因此附带条件。如果您不喜欢无法完全控制数据,那么还有很多其他解决方案。但是,您将为这种控制支付额外费用

    谷歌几乎所有的收入都来自销售广告。Adwords是他们最大的赚钱产品。他们不会给你关于它如何工作的机密信息。他们不知道你是谁,也不知道你将如何处理这些信息。如果你签署保密协议,他们有起诉你的法律追索权,这并不重要;如果你把这些信息泄露给竞争对手,你的生命就不足以偿还你失去他们的钱


    很抱歉告诉你,不管“别作恶”,谷歌是一个企业,不是慈善机构。他们没有成为世界上最成功的公司之一,因为他们没有把搜索算法交给第一个提出要求的人

    仅供参考,我刚刚在上发布了对我网站上的一些glcid数据的快速分析。gclid肯定有一些结构,但很难破译。

    另一种方法是简单地查看参考数据,它至少会提供搜索到的关键字。

    我同意Ophir和Chris的观点。我的感觉是,它纯粹是一个序列号/唯一的点击ID,只有当分析和Adwords系统在幕后相互交谈时,它才会打开它的秘密

    知道了这一点,我建议您查看引用的URL,并尽可能多地从中提取内容,以便在后端单击跟踪设置中使用

    例如,我住在新西兰,正在使用Firefox。这是从Firefox Google工具栏搜索“堆栈溢出”:

    你可以看到:a)im使用.NZ域,b)我的关键字“堆栈+溢出”,c)im运行firefox

    最后,如果您还保存了完整的登录页面URL,那么您可以存储GCLID,它会告诉您访问者来自付费,而如果没有GCLID,那么用户必须来自自然搜索(当然,如果启用了URL标记)

    理论上,这将允许你在你的活动中搜索关键词,并找出它们来自哪个广告群。了解创意可能是不可能的
    .*[?&]gclid=([^$&]*)
    
    .*[?&]q=([^$&]*).*