Google bigquery BigQuery-警告消息:TableXXX高度碎片化

Google bigquery BigQuery-警告消息:TableXXX高度碎片化,google-bigquery,Google Bigquery,今天早上,我查看了BigQuery浏览器工具的查询历史记录,发现我每天运行的查询出现以下错误: Errors: Warning: Table XX:XX.XX@1412077252527-1412682052526 is highly fragmented. Query performance may be impacted. 我已经运行这个查询好几个月了,没有任何错误。关于此错误/警告我能做些什么,有什么线索吗?我认为所有的硬件和索引都应该由谷歌来处理,我们不需要担心 如果这对Google

今天早上,我查看了BigQuery浏览器工具的查询历史记录,发现我每天运行的查询出现以下错误:

Errors:
Warning: Table XX:XX.XX@1412077252527-1412682052526 is highly fragmented. 
Query performance may be impacted.
我已经运行这个查询好几个月了,没有任何错误。关于此错误/警告我能做些什么,有什么线索吗?我认为所有的硬件和索引都应该由谷歌来处理,我们不需要担心


如果这对Google BigQuery团队有帮助,我的作业id是job_iHCt38RHGhT-FV0HR1kNZYAI508。

当支持表的底层数据块的数量与整个表大小相比较大时,您会看到此消息

通常,BigQuery通过定期重写或移动表来管理文件大小,以最大限度地提高查询性能。但是,当您使用时间范围装饰器(看起来您正在使用它)时,bigquery需要使用原始的表表示,因为您要求的是特定时间的表状态


警告是要告诉您,您的查询不会以最佳性能运行。避免这种情况的一种方法是复制表,这将压缩表表示。你也可以忽略这个问题;这并不意味着你的查询会失败,只是它会很慢。避免此问题的另一种方法是在表中运行较少但较大的导入。

感谢Jordan的回答!我认为我的查询失败了,因为在查询历史记录中,我的查询旁边有一个红色感叹号图标。当我将鼠标悬停时,文本是“查询失败”。当流媒体限制为1兆字节时,如何运行更少但更大的导入?我假设该表是使用小型导入作业创建的,而不是通过流式处理创建的。流式插入会定期从流式缓冲区复制到表中,这可能会导致表出现碎片。我们正在积极调整此过程。是的,该表是使用小型导入作业创建的。