Amazon dynamodb 如何通过多个客户端查询DynamoDB中的所有数据_Amazon Dynamodb

Amazon dynamodb 如何通过多个客户端查询DynamoDB中的所有数据

amazon-dynamodb

Amazon dynamodb 如何通过多个客户端查询DynamoDB中的所有数据,amazon-dynamodb,Amazon Dynamodb,我有一个DynamoDB表，有1000万条记录。我需要每24小时对每个记录的主键执行一些计算。为了实现这一点，我可以每24小时查询一次整个表。由于单个DynamoDB查询只返回1MB数据，这将使总查询和计算时间超过24小时，因此我希望有10名工作人员执行DynamoDB查询和计算。我应该如何查询该表，以便一条记录只能由一名工作人员检索，最终检索所有1000万条记录似乎我需要将LastEvaluatedKey保存在某个位置，以便worker 2知道worker 1查询的结束位置，以便继续查询表。

我有一个DynamoDB表，有1000万条记录。我需要每24小时对每个记录的主键执行一些计算。为了实现这一点，我可以每24小时查询一次整个表。由于单个DynamoDB查询只返回1MB数据，这将使总查询和计算时间超过24小时，因此我希望有10名工作人员执行DynamoDB查询和计算。我应该如何查询该表，以便一条记录只能由一名工作人员检索，最终检索所有1000万条记录

似乎我需要将LastEvaluatedKey保存在某个位置，以便worker 2知道worker 1查询的结束位置，以便继续查询表。

DDB

Scan（）

包括要执行的功能

但是，在DDB中处理聚合的推荐方法是使用一个表，并在现有表甚至新表中维护聚合

您也可以选择使用红移或Hive，如回答此问题时所述：

DDB

Scan（）

包括要执行的功能

但是，在DDB中处理聚合的推荐方法是使用一个表，并在现有表甚至新表中维护聚合

您也可以选择使用红移或Hive，如回答此问题时所述：

使用带多线程的并行扫描有助于在合理的时间内处理记录。甚至有一千万。所有AWS SDK都应该使这一点非常容易实现，而无需自己处理

LastEvaluatedKey

。我喜欢你的“使用流聚合”选项。使用多线程并行扫描有助于在合理的时间内处理记录。甚至有一千万。所有AWS SDK都应该使这一点非常容易实现，而无需自己处理

LastEvaluatedKey

。我喜欢您的“使用流聚合”选项。