Amazon dynamodb 从Dynamodb生成报告

Amazon dynamodb 从Dynamodb生成报告,amazon-dynamodb,Amazon Dynamodb,我是DynamoDB的新手,我想知道从这个键/值对数据存储生成报告是否与从DBMS生成报告有什么不同 我的(Java)应用程序将数据写入DynamoDB,我希望从中生成业务报告(例如销售报告) 据我所知,Amazon提供了EMR(elastic Map Reduce),进一步了解,它下面有一个配置单元,允许我使用类似SQL的语法来查询DynamoDB 如果我的数据小于50GB,那么使用EMR是否是过度使用此任务?是hive使用类似SQL的语法。Hive仍然是用java编写的,在幕后它仍然是jav

我是DynamoDB的新手,我想知道从这个键/值对数据存储生成报告是否与从DBMS生成报告有什么不同

我的(Java)应用程序将数据写入DynamoDB,我希望从中生成业务报告(例如销售报告)

据我所知,Amazon提供了EMR(elastic Map Reduce),进一步了解,它下面有一个配置单元,允许我使用类似SQL的语法来查询DynamoDB


如果我的数据小于50GB,那么使用EMR是否是过度使用此任务?

是hive使用类似SQL的语法。Hive仍然是用java编写的,在幕后它仍然是java。这是一个很好的起点。下面是一篇关于将Dynamo DB与EMR结合使用的好文章

如果我的数据小于50GB,使用EMR是否是一种过度使用

我不这么认为,一旦您设置了EMR并将dynamo表导出到s3或内部hadoop表。然后可以查询S3或内部hadoop表,而不影响DynamoDB的临时吞吐量。因为S3非常快,所以您可以编写各种复杂的配置单元查询来获得所需的报告

启动EMR非常容易设置,如果你想省钱,你可以随时为spot实例出价

此外,当作业运行缓慢时,如果愿意,可以增加核心节点和任务节点以使作业快速运行