Session BigQuery中的VisitorID不';不匹配会话谷歌分析

Session BigQuery中的VisitorID不';不匹配会话谷歌分析,session,google-analytics,google-bigquery,Session,Google Analytics,Google Bigquery,我环顾了一下网络,得到了相同的答案:要计算BigQuery中的会话数,请使用count(distinct-concat(fullvisitorID,string(visitID))。但在某些情况下,这甚至不能让我接近谷歌分析的课程。有没有其他方法可以更好地计算会话数?以下是我想做的: SELECT hits.customdimensions.value val, count(*) as pageviews, exact_count_distinct(CONCAT([fullVisitorId],

我环顾了一下网络,得到了相同的答案:要计算BigQuery中的会话数,请使用
count(distinct-concat(fullvisitorID,string(visitID))
。但在某些情况下,这甚至不能让我接近谷歌分析的课程。有没有其他方法可以更好地计算会话数?以下是我想做的:

SELECT hits.customdimensions.value val,
count(*) as pageviews,
exact_count_distinct(CONCAT([fullVisitorId], STRING([visitid]))) sessions
FROM [xxx.ga_sessions_20150619]
where hits.customdimensions.index = 7 and lower(hits.type) = 'page'
group by val
order by pageviews desc
LIMIT 1000

对于某些自定义维度值,该值接近GA,但其他值则相差两倍。有什么方法可以在BQ中获得更好的会话计数吗?

好吧,我真的不能说你的GA数据本身(当然,检查以确保你根本没有对数据进行采样),但是如果你运行以下查询,你将提取每个fullVisitorId的会话计数之和:

SELECT SUM(sessionsPerUser)
  FROM (SELECT fullVisitorId, COUNT(visitNumber) AS sessionsPerUser
    FROM [xxx.ga_sessions_2017yyzz]
    GROUP BY fullVisitorId)