Hadoop与超级计算机

Hadoop与超级计算机,hadoop,bigdata,supercomputers,Hadoop,Bigdata,Supercomputers,我无法理解hadoop的真正本质。 如果我有足够的资源购买一台能够处理数PB数据的超级计算机,那么为什么我需要一个Hadoop基础设施来管理如此巨大的数据呢?Hadoop的全部目的是能够在商品异构机器上处理大量数据。这并不能排除使用超级计算机的可能性。拥有足够的资源往往会让我们哑口无言。让我给你举个例子别担心,它涉及Hadoop,这会让事情变得更清楚。克雷最便宜的超级计算机XC30-AC的成本是500000IIRC美元。一台拥有像样的RAM、CPU和磁盘的像样的计算机的成本是多少?你需要多少钱才

我无法理解hadoop的真正本质。
如果我有足够的资源购买一台能够处理数PB数据的超级计算机,那么为什么我需要一个Hadoop基础设施来管理如此巨大的数据呢?

Hadoop的全部目的是能够在商品异构机器上处理大量数据。这并不能排除使用超级计算机的可能性。

拥有足够的资源往往会让我们哑口无言。让我给你举个例子别担心,它涉及Hadoop,这会让事情变得更清楚。克雷最便宜的超级计算机XC30-AC的成本是500000IIRC美元。一台拥有像样的RAM、CPU和磁盘的像样的计算机的成本是多少?你需要多少钱才能购买一批计算机并共同使用它们的能量?你需要多少空间和资源来放置和处理这些机器?要找到有像样编程技能的人,以便他们能为你写MR作业有多困难

这些只是一些事情。Hadoop是开源的。使用它,并根据您的意愿调整它。通过邮件列表免费获得令人敬畏的支持。不仅是支持,还有建议。我希望你明白我的意思


明智地利用你的资源比仅仅拥有它们更重要

谢谢大家。这个问题是在面试时问我的。我试图用所有这些显而易见的答案说服面试官,但他并不信服。所以我只是想知道hadoop是否有我不知道的独特之处。谢谢你的回复。。这件事我早就知道了。。但这并没有回答我关于hadoop如何优于任何超级计算机的问题,也没有回答成本问题。欢迎@N2M。在什么方面更好?我的更好可能是你的更差。没关系。不要介意。。我相信hadoop之所以成为今天的样子,主要是因为它可以部署在商品硬件上,而且只要考虑商业性,利润的目标是降低成本,因此hadoop肯定是超级计算机的一种选择。而且,由于它的开源和易于使用,任何人和每个人都可以免费使用它,而且提供的支持非常棒。如果我哪里做错了,请纠正我。