Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/typo3/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Performance Google BigQuery耗时太长,但变化不大_Performance_Google Bigquery_Google Cloud Platform - Fatal编程技术网

Performance Google BigQuery耗时太长,但变化不大

Performance Google BigQuery耗时太长,但变化不大,performance,google-bigquery,google-cloud-platform,Performance,Google Bigquery,Google Cloud Platform,BigQuery的一个恼人的特性是其不可预测的行为 最后一个这样的烦恼可以在这个查询中说明 SELECT COUNT(DISTINCT large_table.event_id ) AS large_table_count, COUNT(DISTINCT small_table.pk) AS small_table_count FROM large_table LEFT JOIN small_table ON large_table.ga_user_id = small_table.ga_

BigQuery的一个恼人的特性是其不可预测的行为

最后一个这样的烦恼可以在这个查询中说明

SELECT 
COUNT(DISTINCT large_table.event_id ) AS large_table_count,
COUNT(DISTINCT small_table.pk) AS small_table_count
FROM large_table
LEFT JOIN small_table ON
  large_table.ga_user_id = small_table.ga_user_id
其中大_表~2.5GB,小_表~250mb

当我使用ga_用户id加入时,查询大约需要60秒。更重要的是,它完成了,并且可以在不显著增加时间的情况下增加表的大小。(见截图1)

然而,当我加入一个日期字符串时,查询的时间会达到140秒。(参见屏幕截图2)更重要的是,性能不会随数据大小线性扩展。即使在3000秒之后,查询也不会完成

以下是几点观察: 1) 快照\u日期的可变性小于ga\u用户\u id 2) ga_用户_id和快照_日期都是字符串

我错过了什么?