Google bigquery 在Dataflow SQL中使用动态BigQuery表连接流数据

Google bigquery 在Dataflow SQL中使用动态BigQuery表连接流数据,google-bigquery,google-cloud-dataflow,Google Bigquery,Google Cloud Dataflow,我有一个dataflowsql作业,它将流式PubSub与BigQuery表连接起来,并将结果写入BigQuery表。当我将新记录(新销售区域)添加到我的表“us\u state\u salesregions”时,新销售区域在结果表中不可见 只有在创建新的数据流作业后,新添加的sales_区域才会在查询的结果表中可见 SELECT tr.*, sr.sales_region FROM pubsub.topic.`project-id`.transactions as tr INNER JOI

我有一个dataflowsql作业,它将流式PubSub与BigQuery表连接起来,并将结果写入BigQuery表。当我将新记录(新销售区域)添加到我的表“us\u state\u salesregions”时,新销售区域在结果表中不可见

只有在创建新的数据流作业后,新添加的sales_区域才会在查询的结果表中可见

SELECT tr.*, sr.sales_region
FROM pubsub.topic.`project-id`.transactions as tr
  INNER JOIN bigquery.table.`project-id`.dataflow_sql_dataset.us_state_salesregions AS sr
  ON tr.state = sr.state_code
如何在查询结果中获得新添加的sales_region(无需启动新的数据流作业)?

有界源读取(如BigQuery)被视为静态的,在流式管道过程中不会重新读取

如果您的边表足够小,您可以设置定期重新读取bigtable并基于此进行连接