Google bigquery 对bigquery的查询需要花费大量时间

Google bigquery 对bigquery的查询需要花费大量时间,google-bigquery,Google Bigquery,我刚开始使用bigquery,但担心最佳实践,因为我刚刚启动了一个查询以获得结果,但它比预期的要花很多时间。下面是snap启动的查询 是否有人能指导我快速完成大查询,或者我们没有快速完成大查询的机制作为一般建议,我强烈建议您仔细检查一下。在那里,您将能够从多个角度(I/O、洗牌、特定查询模式……)找到大量关于如何优化BigQuery性能的信息。另外,当您遇到特定的作业错误时,此页也很有用,并且还包含一些处理这些错误的最佳实践。您可能也对使用干运行感兴趣(以及将要处理的数据量,从而估计查询的实际

我刚开始使用bigquery,但担心最佳实践,因为我刚刚启动了一个查询以获得结果,但它比预期的要花很多时间。下面是snap启动的查询


是否有人能指导我快速完成大查询,或者我们没有快速完成大查询的机制作为一般建议,我强烈建议您仔细检查一下。在那里,您将能够从多个角度(I/O、洗牌、特定查询模式……)找到大量关于如何优化BigQuery性能的信息。另外,当您遇到特定的作业错误时,此页也很有用,并且还包含一些处理这些错误的最佳实践。您可能也对使用干运行感兴趣(以及将要处理的数据量,从而估计查询的实际复杂性)。最后,您可以查看,以便更好地了解查询执行情况

关于您的特定用例,让我提供一些提示:

  • 现在,您开始使用BigQuery,从标准SQL开始,而不是从遗留SQL开始(我看到您通过调用表的方式使用遗留SQL,使用
    [project:dataset.table]
    格式)。标准SQL是建议与BigQuery一起使用的语言,虽然可能没有显著的性能差异,但也存在一些差异。您可以使用文档中提供的任何方法
  • 您应该首先放置最大的表(即在联接操作的左侧)

最后,我想分享一些如何更好地处理堆栈溢出的技巧:

  • 不要共享您不想让其他用户知道的数据。例如,理想情况下,项目ID或数据集名称不应共享。因此,建议您在共享任何查询或类似查询之前混淆该数据。在本例中,您使用的是公共数据集,但如果您使用的是自己的数据集,请随意使用占位符
  • 共享代码而不是屏幕截图。通过这种方式,社区可以更好地处理您的问题,因为它可以复制摘录,而无需手动键入
  • 尽可能具体。自行调查,尝试解决您的问题,然后,如果您需要Stack Overflow社区的帮助,请针对您的问题尽可能具体。它将帮助我们缩小解决方案的范围,并尽可能以最佳方式帮助您
  • 访问帮助中心。在那里,你将能够找到大量的信息,以便你为他们找到更好的答案

您需要提供更多详细信息,请复制并粘贴代码。