Python 2.7 每隔一段时间自动将数据存储实体备份/删除到大查询

Python 2.7 每隔一段时间自动将数据存储实体备份/删除到大查询,python-2.7,google-app-engine,transactions,google-cloud-datastore,database-backups,Python 2.7,Google App Engine,Transactions,Google Cloud Datastore,Database Backups,我正在寻找将一些数据流到大查询中,并对谷歌的最佳实践步骤3提出了一个问题。这个过程在高层次上是有意义的,但我正在努力实现步骤3。(我希望将数据存储用作我的事务数据存储。)对于步骤3,表示“从事务数据存储中协调数据并截断未协调的数据表。”。我的问题是,;如果我的对账数据在Google数据存储中,有没有一种方法可以自动备份和删除这些数据而无需手动干预 我知道我可以通过使用。我可以: 1) 暂停对数据存储的所有写入 2) 将数据存储表备份到云存储 3) 删除我刚备份的表中的所有实体。 4) 将备份导入

我正在寻找将一些数据流到大查询中,并对谷歌的最佳实践步骤3提出了一个问题。这个过程在高层次上是有意义的,但我正在努力实现步骤3。(我希望将数据存储用作我的事务数据存储。)对于步骤3,表示“从事务数据存储中协调数据并截断未协调的数据表。”。我的问题是,;如果我的对账数据在Google数据存储中,有没有一种方法可以自动备份和删除这些数据而无需手动干预

我知道我可以通过使用。我可以: 1) 暂停对数据存储的所有写入 2) 将数据存储表备份到云存储 3) 删除我刚备份的表中的所有实体。 4) 将备份导入到大查询中

有没有一种方法可以使这项工作自动化,这样我就不必定期手动完成

实时仪表盘和查询

在某些情况下,将数据流式传输到BigQuery可以对事务数据进行实时分析。由于流式数据可能会出现重复数据,请确保在BigQuery之外有一个主要的事务性数据存储

您可以采取一些预防措施,以确保能够对事务性数据执行分析,并拥有最新的数据视图:

1) 创建两个具有相同架构的表。第一个表用于已对账的数据,第二个表用于未对账的实时数据

2) 在客户端,为记录维护事务数据存储。 激发并忘记这些记录的insertAll()请求。insertAll()请求应将实时的未协调表指定为目标表

3) 每隔一段时间,从事务数据存储中追加已协调的数据,并截断未协调的数据表

4) 对于实时仪表板和查询,可以从两个表中选择数据。未协调的数据表可能包含重复或删除的记录