Google bigquery Google BigQuery价格优化
我正在使用Google BigQuery在我的应用程序中存储用户数据活动 我在BigQuery中创建了一个表,我们称之为“用户活动数据” 这些数据包括许多始终每秒更新的数据用户活动。每秒都会有数千个新数据插入到表中 我对这个表做了很多查询 我知道BigQuery的收费标准是每个查询所使用的数据量。我已经尝试使用数据大小优化我的查询以使用尽可能低的数据量(通过只选择需要的列) 例如:Google bigquery Google BigQuery价格优化,google-bigquery,Google Bigquery,我正在使用Google BigQuery在我的应用程序中存储用户数据活动 我在BigQuery中创建了一个表,我们称之为“用户活动数据” 这些数据包括许多始终每秒更新的数据用户活动。每秒都会有数千个新数据插入到表中 我对这个表做了很多查询 我知道BigQuery的收费标准是每个查询所使用的数据量。我已经尝试使用数据大小优化我的查询以使用尽可能低的数据量(通过只选择需要的列) 例如: SELECT username,activity FROM user_activities_data WHERE
SELECT username,activity FROM user_activities_data WHERE date_activities>='2016-10-01' and date_activities<='2016-10-31'
从用户活动数据中选择用户名、活动,其中日期活动>='2016-10-01'和日期活动需要使用
例如,您需要创建一个按天进行类型分区的表。然后您可以像下面这样写入每天的数据mydataset.表$20160519
,您将像下面这样进行查询:
SELECT
field1
FROM
mydataset.partitioned_table
WHERE
_PARTITIONTIME BETWEEN TIMESTAMP("2016-05-01")
AND TIMESTAMP("2016-05-06")
如您所见,伪列\u PARTITIONTIME
是一种将查询限制为仅触及分区的方法。这意味着查询价格将只计算到在所述日期间隔内接触的数据,而不是整个表。这也不会阻止您执行完整表查询