Amazon dynamodb 用于Apache Hadoop的emr dynamodb连接器

Amazon dynamodb 用于Apache Hadoop的emr dynamodb连接器,amazon-dynamodb,amazon-emr,Amazon Dynamodb,Amazon Emr,我有一个EMR,打算在dynamo DB上做积垢操作,作为我减速器的一部分 注意:我没有使用Hive或Spark,也没有使用ApacheHadoop。有关于如何从我的EMR连接到Dynamo DB的文档吗?是开源库,包括Hadoop类,如DynamoDBInputFormat,DefaultDynamoDBRecordReader,用于从DynamoDB读取数据(并行扫描),并进行读取速率控制& DynamoDBOutputFormatDefaultDynamoDBRecordWriter用于向

我有一个EMR,打算在dynamo DB上做积垢操作,作为我减速器的一部分

注意:我没有使用Hive或Spark,也没有使用ApacheHadoop。有关于如何从我的EMR连接到Dynamo DB的文档吗?

是开源库,包括Hadoop类,如
DynamoDBInputFormat
DefaultDynamoDBRecordReader
,用于从DynamoDB读取数据(并行扫描),并进行读取速率控制&
DynamoDBOutputFormat
DefaultDynamoDBRecordWriter
用于向DynamoDB写入(使用BatchWrites API)并控制写入速率以避免节流

我认为除了这个开源库之外,没有更多的AWS文档

所有EMR集群都应该有该库的预构建包(EMR dynamodb工具除外),通常@
/usr/share/aws/EMR/ddb/lib/EMR ddb hadoop.jar
,并包含在EMR hadoop的类路径中。因此,您可以通过使用配置设置所需的配置(包括DynamoDB),在MR应用程序上使用这个JAR中的Hadoop InputFormat和OutputFormat实现