Google analytics BigQuery数据与谷歌分析

Google analytics BigQuery数据与谷歌分析,google-analytics,google-bigquery,Google Analytics,Google Bigquery,我似乎无法在BigQuery中获得与Google Analytics Premium相同数量的会话和用户。我使用fullvisitorID计算会话数计数和用户唯一计数,如果这与Google Analytics中的数字不一致?更新:BQ现在支持精确计数功能 正如@Pentium10所说,COUNTDISTINCT x给出了BigQuery上大数字的近似结果 精确结果的2个备选方案: COUNT(DISTINCT x, 10000) 如果所述计数小于10000,则给出精确计数。将值更改为更高或更慢

我似乎无法在BigQuery中获得与Google Analytics Premium相同数量的会话和用户。我使用fullvisitorID计算会话数计数和用户唯一计数,如果这与Google Analytics中的数字不一致?

更新:BQ现在支持精确计数功能

正如@Pentium10所说,COUNTDISTINCT x给出了BigQuery上大数字的近似结果

精确结果的2个备选方案:

COUNT(DISTINCT x, 10000)
如果所述计数小于10000,则给出精确计数。将值更改为更高或更慢的结果

SELECT COUNT(*) FROM (
  SELECT x
  FROM [table]
  GROUP EACH BY x
)
也以精确的方式计算不同的值。

虽然@Felipe Hoffa正确地认为COUNTDISTINCT x,10000将使您得到更精确的数字,但可以通过将10000数字增加到1000000,进一步增强它,我相信这是目前最大的采样率:。由于在BigQuery中使用Google Anaytics Premium数据的人并不多,因此针对这些问题的社区非常小。作为一个每天都在BigQuery中使用GA数据的人,我可以告诉你,我的研究和验证表明,以下指标定义与Google Analytics UnSampled Report将告诉你的内容非常接近

会议

使用者

新用户

独特的浏览量

反弹


你可以发布一些查询和数字,以便更好地指导你获得比你预期的更少或更多的用户。另外,请知道COUNTDISTINCT只是一个近似数字,请阅读更多信息,我使用Simba连接器将数据提取到Alteryx,从中混合数据。“count distinct”怎么可能只是一个近似数字,如果我导出所有FullVisitorid,那么我应该能够测量一天中会话和用户的数量,是正确的还是错误的?我应该使用另一个度量吗?更新:BQ现在支持精确计数功能。
count(distinct concat(fullvisitorid, string(visitid)), 1000000) as sessions
count(distinct fullvisitorid, 1000000) as users
count(distinct (case when totals.newvisits <> 0 then concat(fullvisitorid, string(visitid)) end), 1000000) as new_users
sum(case when hits.type = "PAGE" then 1 else 0 end) as pageviews
count(distinct (case when hits.type = "PAGE" then concat(fullvisitorid, string(visitid), hits.page.pagepath) end), 1000000) as unique_pageviews
count(distinct (case when totals.bounces <> 0 then concat(fullvisitorid, string(visitid)) end), 1000000) as bounces