Hadoop和Map/Reduce对大型并行进程有用吗?

Hadoop和Map/Reduce对大型并行进程有用吗?,hadoop,amazon-ec2,parallel-processing,Hadoop,Amazon Ec2,Parallel Processing,我对Hadoop和Map/Reduce有一个肤浅的理解。我认为它对于运行许多小型独立进程的实例非常有用。但是,我可以使用这个基础架构(具有容错性、可伸缩性和易用性)来运行大型独立流程吗 假设我想对我公司(600)的客户的状态进行某种分析,这种分析需要大约1分钟的过程,访问各种静态数据,但一个客户的分析与其他客户的分析无关。现在我有10个小时的集中处理时间,但是如果我可以将这个处理分配到20个节点中,我可以在大约半小时内完成它(加上由于数据复制而产生的一些开销)。如果我能以合理的价格在Amazon

我对Hadoop和Map/Reduce有一个肤浅的理解。我认为它对于运行许多小型独立进程的实例非常有用。但是,我可以使用这个基础架构(具有容错性、可伸缩性和易用性)来运行大型独立流程吗

假设我想对我公司(600)的客户的状态进行某种分析,这种分析需要大约1分钟的过程,访问各种静态数据,但一个客户的分析与其他客户的分析无关。现在我有10个小时的集中处理时间,但是如果我可以将这个处理分配到20个节点中,我可以在大约半小时内完成它(加上由于数据复制而产生的一些开销)。如果我能以合理的价格在AmazonEC2中租用100个节点,这将在大约6分钟内完成,这将从根本上改变我分析的可用性

Hadoop是解决我的问题的正确工具吗?它能否运行每次需要1分钟的大型映射程序进程?如果没有,我应该去哪里看

提前谢谢