Hadoop mapreduce的缺点是什么?
mapreduce的缺点是什么?mapreduce有很多优点。但是我也想知道mapreduce的缺点Hadoop mapreduce的缺点是什么?,hadoop,mapreduce,Hadoop,Mapreduce,mapreduce的缺点是什么?mapreduce有很多优点。但是我也想知道mapreduce的缺点 首先,它将映射输出流化,如果可以将其保存在内存中,则效率会更高。我最初使用MPI部署我的算法,但当我放大一些节点时,开始交换,这就是我进行转换的原因 名称节点跟踪分布式文件系统中所有文件的元数据。我正在读一本hadoop书籍(hadoop in action),其中提到Yahoo估计每个文件的元数据大约为600字节。这意味着,如果文件太多,Namenode可能会遇到问题 如果您不想使用流式API
我宁愿问什么时候mapreduce不是一个合适的选择?我认为如果您按预期使用它,您不会看到任何缺点。尽管如此,在某些情况下,mapreduce不是一个合适的选择:
- 实时处理
- 作为MR程序来实现每一项和每一件事情并不总是非常容易
- 当您的中间进程需要相互通信时(作业独立运行)
- 当处理需要通过网络对大量数据进行洗牌时
- 当您需要处理流数据时。MR最适合于批处理您已经拥有的大量数据
- 当您可以使用独立系统获得所需的结果时。与分布式系统相比,配置和管理独立系统显然不那么痛苦
- 当您有OLTP需求时。MR不适用于大量的短期在线交易
HTH这里有一些MapReduce不能很好工作的用例
如果您不想使用java,您可以始终使用流。NN与MR无关。这是运行mapreduce的架构的一个限制,因此需要记住,尽管您是对的,但它不一定严格与MR相关。mapreduce可以在任何地方运行,而不仅仅是HDFS。NN是HDFS特有的。如果您在HDFS中存储了大量非常小的文件,那么您将看到元数据问题,这同样不是Hadoop平台的高效使用。但是,我同意。你说的也对。这个问题是针对MR框架的,所以我想提一下。