Php URL中不必要的数据Google Analytics

Php URL中不必要的数据Google Analytics,php,url,google-analytics,google-analytics-api,Php,Url,Google Analytics,Google Analytics Api,我已经在我的项目中设置了Google Analytics跟踪代码。 现在,我想检查一下,有多少用户点击了我网站上的某个url。 url参数因用户而异。我想将它们分组在一个主子url下 我尝试的是设置Google Analytics将排除的所有参数,同时收集这些信息:使用排除URL查询参数文本框 假设这是我的URL: www.example.com/petDetails?petType=Cat&PetColor=Black www.example.com/petDetails?petType=Do

我已经在我的项目中设置了Google Analytics跟踪代码。 现在,我想检查一下,有多少用户点击了我网站上的某个url。 url参数因用户而异。我想将它们分组在一个主子url下

我尝试的是设置Google Analytics将排除的所有参数,同时收集这些信息:使用排除URL查询参数文本框

假设这是我的URL:

www.example.com/petDetails?petType=Cat&PetColor=Black

www.example.com/petDetails?petType=Dog&PetColor=white

因此,将上述URL仅分组在内部

“/petDetails”

这适用于少数URL。但我发现了一些奇怪的数据,比如

www.example.com/petDetails#1102petType=Cat&PetColor=Black

www.example.com/petDetails#45654petType=Dog&PetColor=white

请注意#someNumber部分。在代码中的任何地方,我都添加了这样的数字,并附加了#

GA中的报告中有大量这样的URL,这些URL没有在内部分组

“/petDetails”

因此,为每个项目创建唯一的条目

如何消除此问题。 任何帮助都将不胜感激。如果您需要更多的数据,请随时询问

在代码中的任何地方,我都添加了这样的数字,并附加了#

看起来您的站点上有指向hashtags/fragments的锚定标记。它用于导航到页面上的特定点

也许你没有在你的页面上明确地建立指向它们的链接,尽管你很可能没有

但是,对于访问者来说,查看页面的一个部分/页眉,看到有一个id='foo'属性,然后只需将'#foo'添加到URL即可直接访问它,这也很容易

但这比第一个场景的可能性要小得多,在第一个场景中,您实际上有这样的链接(或利用它进行导航的框架)

在任何情况下,如果您想确保报告的URI只有路径,没有查询字符串或哈希,我建议您创建一个过滤器来去除它们

进入Google Analytics并导航到视图的Admin/Config,单击过滤器,然后单击红色的新过滤器按钮

选择创建新过滤器单选按钮

对于过滤器名称将其命名为“URI-strip query,hash”

对于过滤器类型,选择自定义,然后选择高级单选按钮

对于字段A->提取A,选择“请求URI”,然后在文本字段中输入以下内容:
^([^?#]+)

字段B->提取B留空;你不需要它

对于输出到->构造函数,选择“请求URI”,然后在文本字段中输入以下内容:
$A1

在之后的复选框中,确保选中以下内容: 字段A为必填项覆盖输出字段

最后,保存过滤器

编辑:


感谢一吨蜡笔,为详细的步骤。成功了!。但是你愿意吗 请解释一下输出到->构造函数字段?我不能 我似乎明白了

好的,高级自定义过滤器是一种将内容从一个项目推送到另一个项目的方法。它使您能够在不更改站点代码的情况下填充(或覆盖)内容。因此,在上面的场景中,它用于修改报告的URI。另一种常见的情况是,对于在多个域上具有页面的视图,在URI前面加上主机名

因此,基本上您可以在字段A字段B中使用正则表达式来匹配您想要从指定源获得的内容。regex语法的一部分是对模式的一部分(或全部)进行分组(通过在模式部分周围加括号),您可以稍后引用捕获的组

GA有特殊的语法来引用它,因为它的接口/设置约定。因此,
$A
是引用字段A中捕获的组的前缀。然后,后面的数字就是捕获的组,例如,
$A1
引用字段A中的第一个捕获组。在上面的场景中,我们只使用一个字段,并且只捕获了一个组

最后,所有这些都将进入覆盖到字段,这是您要用值(在本场景中为URI)弹出(或覆盖)的字段,而构造函数就是您要用它覆盖的内容

因此,总体而言,我们使用当前URI,使用正则表达式模式
^([^?#]+)
只匹配第一个
(查询字符串定界符)或
(哈希/片段定界符),以先到者为准,并将其捕获为组
$A1
。然后我们用该值覆盖URI,这有效地去除了该内容的URI


旁注:我看到很多人(包括我自己,在我刚接触它的时候)对高级定制过滤器感到困惑。在我看来,如果GA将表单字段的foo->bar标签更改为正确对齐的标签,并将其重新标记为“新值”而不是“构造函数”,则更容易理解

感谢一吨蜡笔,为详细的步骤。成功了!。但是请您解释一下输出到->构造函数字段好吗?我似乎不明白。