Google bigquery 无法在分配的内存中执行查询

Google bigquery 无法在分配的内存中执行查询,google-bigquery,Google Bigquery,我有一个简单的查询要运行: update`dataset.mytable` set field_1 = cast( field_2 as int64) where field_2 not in ('AA', 'BB') 我得到了一个错误: 错误:查询执行期间超出了资源:无法在分配的内存中执行查询 该表只有10亿行…这确实是一个bug,类似于。在这种情况下,您没有办法知道,但是如果您将来确实发现了bug,您可以知道,因为更广泛的StackOverflow社区可能无法提供帮助 作为对所发生事件的

我有一个简单的查询要运行:

update`dataset.mytable`
set field_1 = cast( field_2 as int64) 
where field_2 not in ('AA', 'BB')
我得到了一个错误:

错误:查询执行期间超出了资源:无法在分配的内存中执行查询


该表只有10亿行…

这确实是一个bug,类似于。在这种情况下,您没有办法知道,但是如果您将来确实发现了bug,您可以知道,因为更广泛的StackOverflow社区可能无法提供帮助

作为对所发生事件的总结:

  • 看起来加载到表中的文件相当大,例如,每个文件的大小都有好几GB。加载较小的文件不会触发BigQuery错误
  • 将这些文件的内容持久化到BigQuery存储时,BigQuery没有充分地切分表(这是BigQuery方面的错误)
  • 在执行
    UPDATE
    语句时,BigQuery试图只跨少量分区执行大量工作,导致
    资源超出
    消息
  • 我可以通过手动指示BigQuery存储重新硬处理表来解决这个问题。这不是通过BigQueryAPI公开的,因为除非有bug,否则不需要它

    • 这确实是一个bug,类似于。在这种情况下,您没有办法知道,但是如果您将来确实发现了bug,您可以知道,因为更广泛的StackOverflow社区可能无法提供帮助

      作为对所发生事件的总结:

      • 看起来加载到表中的文件相当大,例如,每个文件的大小都有好几GB。加载较小的文件不会触发BigQuery错误
      • 将这些文件的内容持久化到BigQuery存储时,BigQuery没有充分地切分表(这是BigQuery方面的错误)
      • 在执行
        UPDATE
        语句时,BigQuery试图只跨少量分区执行大量工作,导致
        资源超出
        消息
      • 我可以通过手动指示BigQuery存储重新硬处理表来解决这个问题。这不是通过BigQueryAPI公开的,因为除非有bug,否则不需要它


      可能重复@JarrodRoberson这是另一个问题;没有明确的订单。Bignona,你能分享一个演示失败的示例作业ID吗?我想进一步了解发生了什么。你能再次尝试运行你的查询吗?目前有一个问题似乎是它导致了这里的问题,但我能够在您的表上运行一个进程,在这个特定的情况下应该解决它。哦,太好了。你已经修好了。你表演了什么魔术?我之前也在同一个表上运行了一个查询,将另一个相同大小的表连接起来,结果用了7227.9秒才完成,这正常吗?我很高兴这样做有效!我将添加一个更详细的解释。这可能是因为表的问题使得连接速度比它应该的慢;没有明确的订单。Bignona,你能分享一个演示失败的示例作业ID吗?我想进一步了解发生了什么。你能再次尝试运行你的查询吗?目前有一个问题似乎是它导致了这里的问题,但我能够在您的表上运行一个进程,在这个特定的情况下应该解决它。哦,太好了。你已经修好了。你表演了什么魔术?我之前也在同一个表上运行了一个查询,将另一个相同大小的表连接起来,结果用了7227.9秒才完成,这正常吗?我很高兴这样做有效!我将添加一个更详细的解释。这可能是因为这个表的问题使得加入的速度比它应该的要慢。我认为保持它的整洁和遵守网站的规则是我们的最大利益。如果是我的话,我会代表OP-on创建相应的问题,并在那里处理这个问题。我只是想和你分享我的想法-我非常尊重你,所以希望你不要亲自得到这些!:o) 我想现在结束这个问题就好了。OP可以使用一个bug来跟踪潜在的问题,我可以在任何情况下帮助解决眼前的问题。谢谢谢谢你的支持/理解我仍然投票支持你的答案,因为你当之无愧:o)谢谢你的意见。我想知道你所说的加载到表中的文件是什么意思,这个问题中的表是通过连接前两个表创建的。您是否引用加载到BigQuery表的GCS中的原始文件?你认为这样的错误什么时候会被修复,在错误修复之前,我怎样才能防止这种情况在我这边发生?请跟踪我链接的错误,应该有人能够帮助解释更多。我认为保持这样的整洁并遵守网站规则是我们的最大利益。如果是我的话,我会代表OP-on创建相应的问题,并在那里处理这个问题。我只是想和你分享我的想法-我非常尊重你,所以希望你不要亲自得到这些!:o) 我想现在结束这个问题就好了。OP可以使用一个bug来跟踪潜在的问题,我可以在任何情况下帮助解决眼前的问题。谢谢谢谢你的支持/理解我仍然投票支持你的答案,因为你当之无愧:o)谢谢你的意见。我想知道你所说的加载到表中的文件是什么意思,这个问题中的表是通过连接前两个表创建的。您是否引用加载到BigQuery表的GCS中的原始文件?您希望何时修复此类错误?在修复错误之前,我如何防止这种情况发生在我这边?请跟踪我链接的错误,应该有人能够帮助解释更多。