Amazon dynamodb 如何通过多个客户端查询DynamoDB中的所有数据

Amazon dynamodb 如何通过多个客户端查询DynamoDB中的所有数据,amazon-dynamodb,Amazon Dynamodb,我有一个DynamoDB表,有1000万条记录。我需要每24小时对每个记录的主键执行一些计算。为了实现这一点,我可以每24小时查询一次整个表。由于单个DynamoDB查询只返回1MB数据,这将使总查询和计算时间超过24小时,因此我希望有10名工作人员执行DynamoDB查询和计算。我应该如何查询该表,以便一条记录只能由一名工作人员检索,最终检索所有1000万条记录 似乎我需要将LastEvaluatedKey保存在某个位置,以便worker 2知道worker 1查询的结束位置,以便继续查询表。

我有一个DynamoDB表,有1000万条记录。我需要每24小时对每个记录的主键执行一些计算。为了实现这一点,我可以每24小时查询一次整个表。由于单个DynamoDB查询只返回1MB数据,这将使总查询和计算时间超过24小时,因此我希望有10名工作人员执行DynamoDB查询和计算。我应该如何查询该表,以便一条记录只能由一名工作人员检索,最终检索所有1000万条记录

似乎我需要将LastEvaluatedKey保存在某个位置,以便worker 2知道worker 1查询的结束位置,以便继续查询表。

DDB
Scan()
包括要执行的功能

但是,在DDB中处理聚合的推荐方法是使用一个表,并在现有表甚至新表中维护聚合

您也可以选择使用红移或Hive,如回答此问题时所述:

DDB
Scan()
包括要执行的功能

但是,在DDB中处理聚合的推荐方法是使用一个表,并在现有表甚至新表中维护聚合


您也可以选择使用红移或Hive,如回答此问题时所述:

使用带多线程的并行扫描有助于在合理的时间内处理记录。甚至有一千万。所有AWS SDK都应该使这一点非常容易实现,而无需自己处理
LastEvaluatedKey
。我喜欢你的“使用流聚合”选项。使用多线程并行扫描有助于在合理的时间内处理记录。甚至有一千万。所有AWS SDK都应该使这一点非常容易实现,而无需自己处理
LastEvaluatedKey
。我喜欢您的“使用流聚合”选项。