如何采样Adobe Analytics(Omniture)数据

如何采样Adobe Analytics(Omniture)数据,adobe,sampling,adobe-analytics,Adobe,Sampling,Adobe Analytics,我在网上找不到关于如何采样Adobe Analytics数据的任何信息?我需要将Adobe Analytics集成到一个流量巨大的新网站中,以便利益相关者希望对数据进行采样,以避免过高的服务器调用。我正在使用DTM,但不确定这是否会有帮助,还是不是一个因素?有人能给我指出一些文档或给我一些如何做的指导吗?Adobe Analytics没有任何内置的数据采样方法,无论是在其一端还是在js代码中 DTM也不提供类似的服务。它没有任何(公开的)机制来评估对给定属性(容器)的所有请求;任何将状态扩展到“

我在网上找不到关于如何采样Adobe Analytics数据的任何信息?我需要将Adobe Analytics集成到一个流量巨大的新网站中,以便利益相关者希望对数据进行采样,以避免过高的服务器调用。我正在使用DTM,但不确定这是否会有帮助,还是不是一个因素?有人能给我指出一些文档或给我一些如何做的指导吗?

Adobe Analytics没有任何内置的数据采样方法,无论是在其一端还是在js代码中

DTM也不提供类似的服务。它没有任何(公开的)机制来评估对给定属性(容器)的所有请求;任何将状态扩展到“命中”范围之外的规则都是基于cookie的

Adobe Target确实提供了基于%流量输出代码的能力,因此您可以通过这种方式实现采样,但实际上,您只是在用一个服务器调用成本换取另一个服务器调用成本

基本上,您唯一的解决方案是创建自己的服务器端框架,用于有条件地输出Adobe Analytics(或DTM)标记,以实现使用Adobe Analytics进行采样

更新:

@MichaelJohns评论如下:


我们有一个文件,我们使用它作为引导文件来服务于DTM文件。 我想我们要做的是使用一些JS逻辑和cookie 以此来确定是否应该向访问者提供DTM代码

好吧,也许我误解了你的目标(但我不这么认为),但那是行不通的

例如,如果您只想为50%的访问者输出跟踪,您将如何单独使用javascript和Cookie来实现这一点?为了知道你只过滤了50%,你需要知道参与游戏的总人数。javascript和Cookie本身只知道一个浏览器,一个人。它无法了解其他99人的任何情况,除非他们之间有某种共享状态,比如在数据库服务器端跟踪计数

仅使用javascript和Cookie就可以做的最好的事情是基本上可以抛硬币。在这个50%的例子中,基本上你会选择一个介于1和100之间的随机值,下半部分没有跟踪,上半部分跟踪

问题是摆锤可能100%左右摆动。这与连续100次翻转硬币的原理相同:完全有可能100次都落在尾巴上

理论上,随着时间的推移,趋势应显示出50/50的总体平均值,但这有一个主要缺陷,即你可能在一个月内拥有大量流量,而在另一个月内拥有少量流量。或者你可以有一个星期的交通量很少,然后是一天的交通量。你真的不知道随着时间的推移这将如何表现出来;你不可能真正知道你的钟摆是朝哪个方向摆动的,除非你真的记录了100%的流量。所有这一切的影响是,它将绝对破坏您的趋势数据,这是进行任何有意义分析的核心原则

因此,基本上,如果您真的想可靠地将跟踪输出到%的流量,您将需要一种机制,它实际上记录了100%的流量。如果我要推出自己自制的“采样器”,我会这样做:

在平面文件或数据库表中,我将有两列,一列表示“是”,一列表示“否”。每次提出请求时,我都会寻找cookie。如果cookie不存在,我将其视为新访问者。由于它是一个新的访问者,我将其中一列增加1

哪一个?这取决于我希望(不希望)跟踪的流量的百分比。在这个例子中,我们正在做一个非常简单的50/50分割,所以实际上,我需要做的就是增加其中的一个,如果它们当前都相等,我可以随机选择一个。如果要进行更不均匀的分割,例如30%跟踪,70%未跟踪,则公式会变得更复杂。但这是一个不同的讨论主题(还有,有很多比我聪明得多的人发表的论文、文档和维基,比我解释得好得多!)

然后,如果命中注定我增加了“yes”列,我将“track”cookie设置为“yes”。否则,我将“track”cookie设置为“no”

然后在我的控制器中(或引导、路由器,无论所有请求通过什么),我都会查找名为“track”的cookie,看看它的值是“yes”还是“no”。如果“是”,则输出跟踪脚本。如果是“不”,那么我就不会

因此,总的来说,过程将是:

  • 提出请求
  • 找饼干
  • 如果未设置cookie,则更新数据库/平面文件,增加是或否
  • 将cookie设置为yes或no
  • 如果cookie设置为yes,则输出跟踪
  • 如果cookie设置为“否”,则不输出跟踪
注意:根据服务器的语言/技术,在下一个请求之前,实际上不会设置cookie,因此您可能需要加入逻辑以查找db/flatfile更新返回的值,然后在最后两个步骤中回退到查找cookie值

另一个(更一般的)注意:一般来说,你应该小心取样。的确,一些跟踪工具(最著名的是谷歌分析)对数据进行采样。但问题是,它最初记录所有数据,然后使用复杂的算法从中采样,包括排除/免除某些关键指标的采样(如购买、目标等)

想一想。即使你像上面所描述的那样花时间设置一个合适的“采样器”,你基本上是在扔出窗口数据,证明人们在你的网站上做着关键的事情——这些重要的事情可以帮助你决定去哪里,从而给访问者一个更好的体验