Sql BigQuery:在群集字段上联接

Sql BigQuery:在群集字段上联接,sql,performance,google-bigquery,Sql,Performance,Google Bigquery,我试图通过使用集群表来优化我们的BigQuery模型 我正在测试这些场景: 群集表联接群集表(按群集联接字段) 非聚集表联接非聚集表(通过与场景1相同的字段联接) 如果场景1和场景2的成本(处理的时间和字节)相等,则不应用任何条件。 当我通过集群字段应用条件时,1的速度是4倍,而且更便宜 聚集字段仅在查询中使用条件时有用?而不是加入? 在这种情况下,如果我在没有任何条件的情况下执行联接,那么无论是否使用集群,性能都是相同的 如何改进BigQuery中两个表之间的连接 编辑2021-05-31 添

我试图通过使用集群表来优化我们的BigQuery模型

我正在测试这些场景:

  • 群集表联接群集表(按群集联接字段)
  • 非聚集表联接非聚集表(通过与场景1相同的字段联接)
  • 如果场景1和场景2的成本(处理的时间和字节)相等,则不应用任何条件。 当我通过集群字段应用条件时,1的速度是4倍,而且更便宜

    聚集字段仅在查询中使用条件时有用?而不是加入? 在这种情况下,如果我在没有任何条件的情况下执行联接,那么无论是否使用集群,性能都是相同的

    如何改进BigQuery中两个表之间的连接

    编辑2021-05-31

    添加两个作业的查询执行计划:


  • 查看这两个作业的查询执行计划(使用/o集群字段)会很有帮助。这可以解释为什么性能没有提升。一个问题:加入时,是否保持聚集字段的相同顺序?此外,是否需要加入完整的表?因为如果先过滤然后加入.Alvaro,可以提高性能和成本,所以我用这两个执行计划更新帖子。关于连接完整表的需要:我正在测试如何执行一个典型的查询,因此对于这个测试是必要的。