Google bigquery 对bigquery的查询需要花费大量时间
我刚开始使用bigquery,但担心最佳实践,因为我刚刚启动了一个查询以获得结果,但它比预期的要花很多时间。下面是snap启动的查询Google bigquery 对bigquery的查询需要花费大量时间,google-bigquery,Google Bigquery,我刚开始使用bigquery,但担心最佳实践,因为我刚刚启动了一个查询以获得结果,但它比预期的要花很多时间。下面是snap启动的查询 是否有人能指导我快速完成大查询,或者我们没有快速完成大查询的机制作为一般建议,我强烈建议您仔细检查一下。在那里,您将能够从多个角度(I/O、洗牌、特定查询模式……)找到大量关于如何优化BigQuery性能的信息。另外,当您遇到特定的作业错误时,此页也很有用,并且还包含一些处理这些错误的最佳实践。您可能也对使用干运行感兴趣(以及将要处理的数据量,从而估计查询的实际
是否有人能指导我快速完成大查询,或者我们没有快速完成大查询的机制作为一般建议,我强烈建议您仔细检查一下。在那里,您将能够从多个角度(I/O、洗牌、特定查询模式……)找到大量关于如何优化BigQuery性能的信息。另外,当您遇到特定的作业错误时,此页也很有用,并且还包含一些处理这些错误的最佳实践。您可能也对使用干运行感兴趣(以及将要处理的数据量,从而估计查询的实际复杂性)。最后,您可以查看,以便更好地了解查询执行情况 关于您的特定用例,让我提供一些提示:
- 现在,您开始使用BigQuery,从标准SQL开始,而不是从遗留SQL开始(我看到您通过调用表的方式使用遗留SQL,使用
格式)。标准SQL是建议与BigQuery一起使用的语言,虽然可能没有显著的性能差异,但也存在一些差异。您可以使用文档中提供的任何方法[project:dataset.table]
- 您应该首先放置最大的表(即在联接操作的左侧)
最后,我想分享一些如何更好地处理堆栈溢出的技巧:
- 不要共享您不想让其他用户知道的数据。例如,理想情况下,项目ID或数据集名称不应共享。因此,建议您在共享任何查询或类似查询之前混淆该数据。在本例中,您使用的是公共数据集,但如果您使用的是自己的数据集,请随意使用占位符
- 共享代码而不是屏幕截图。通过这种方式,社区可以更好地处理您的问题,因为它可以复制摘录,而无需手动键入
- 尽可能具体。自行调查,尝试解决您的问题,然后,如果您需要Stack Overflow社区的帮助,请针对您的问题尽可能具体。它将帮助我们缩小解决方案的范围,并尽可能以最佳方式帮助您
- 访问帮助中心。在那里,你将能够找到大量的信息,以便你为他们找到更好的答案