Google bigquery BigQuery性能:这是正确的吗?

Google bigquery BigQuery性能:这是正确的吗?,google-bigquery,database-performance,Google Bigquery,Database Performance,各位,我使用BigQuery作为我的分析查询的超高速数据库,但我对它的性能非常失望 让我给你看看数字: “from”子句中只有一个表 选择约15个字段,每个字段按分组,选择约5个字段和SUM() 表行总数:370万 返回的行总数:830K 当我在BigQuery的控制台上执行此查询时,处理大约需要1分钟。这对你合适吗?我原以为它会在2秒钟后回来。。。如果我在一个列式数据库(如Sybase IQ)上执行此查询,所需时间不到2秒。因为您返回的是830k行,而BQ总是创建一个临时结果表,所以创建的

各位,我使用BigQuery作为我的分析查询的超高速数据库,但我对它的性能非常失望

让我给你看看数字:

  • “from”子句中只有一个表
  • 选择约15个字段,每个字段按分组,选择约5个字段和SUM()
  • 表行总数:370万
  • 返回的行总数:830K

当我在BigQuery的控制台上执行此查询时,处理大约需要1分钟。这对你合适吗?我原以为它会在2秒钟后回来。。。如果我在一个列式数据库(如Sybase IQ)上执行此查询,所需时间不到2秒。

因为您返回的是830k行,而BQ总是创建一个临时结果表,所以创建的结果不仅仅是一个小结果

你打开大结果了吗

我们在共享环境中工作,有时加载(表创建)需要一段时间。
当然,性能不同于专用环境。在成为“超级快速”数据库之前,Big Query是一个高度可扩展的数据库。它的设计目的是使用一种名为Dremel的技术处理大量数据,这些数据分布在多台不同的机器之间。因为它被设计为使用多台机器和并行处理,所以您应该期望具有具有良好性能的超级可扩展性

例如:在5-10秒内分析所有维基百科的修订版并不坏,是吗?但是,即使是一张小得多的桌子也需要大约相同的时间

Sybase IQ通常安装在单个数据库中,不使用Dremel。这就是说,在许多情况下,它将比大查询更快……正如设计的那样

干杯

可能重复的