Hadoop 如何估计Amazon EMR中的实例数?

Hadoop 如何估计Amazon EMR中的实例数?,hadoop,amazon-ec2,mapreduce,amazon-emr,Hadoop,Amazon Ec2,Mapreduce,Amazon Emr,我有一个map reduce作业要在Amazon EMR上运行。我想有多达400个映射器和还原器,我想使用中型或大型实例。如何估计所需的实例数 此外,如果一个作业在2分钟内结束,我运行另一个作业需要4分钟,我将收取2小时的费用还是1小时的费用?我知道您是否使用CLI工具创建作业流并添加步骤,然后,您可以在同一个作业流上依次运行这两个步骤,它们将在同一小时内计数 我相信如果你使用GUI,那么你就不能重复使用作业流,因此你可能会为每项作业收取一小时的费用。我还没试过,所以可能是错的 查看这篇文章,这

我有一个map reduce作业要在Amazon EMR上运行。我想有多达400个映射器和还原器,我想使用中型或大型实例。如何估计所需的实例数


此外,如果一个作业在2分钟内结束,我运行另一个作业需要4分钟,我将收取2小时的费用还是1小时的费用?

我知道您是否使用CLI工具创建作业流并添加步骤,然后,您可以在同一个作业流上依次运行这两个步骤,它们将在同一小时内计数

我相信如果你使用GUI,那么你就不能重复使用作业流,因此你可能会为每项作业收取一小时的费用。我还没试过,所以可能是错的

查看这篇文章,这是我获得信息的地方:


您是如何计算映射器/还原器的数量的?使用映射器=400=还原器,您真的会获得任何优势吗?这取决于您的处理需求。我根本不明白你问题的第二部分。