MapReduce 2与纱线应用
我对如何开发新的MapReduce2应用程序来使用Thread以及如何使用旧的MapReduce2应用程序感到有点困惑 我目前有MapReduce1应用程序,主要包括:MapReduce 2与纱线应用,mapreduce,yarn,hadoop2,Mapreduce,Yarn,Hadoop2,我对如何开发新的MapReduce2应用程序来使用Thread以及如何使用旧的MapReduce2应用程序感到有点困惑 我目前有MapReduce1应用程序,主要包括: 配置要提交到集群的作业的驱动程序(以前的JobTracker,现在的ResourceManager) 映射器+还原器 从一个方面看,我看到用MapReduce1编码的应用程序与MapReduce2/Thread兼容,但需要注意的是,只需重新编译新的CDH5库(我使用Cloudera发行版) 但从另一方面看,我看到了关于以不同
- 配置要提交到集群的作业的驱动程序(以前的JobTracker,现在的ResourceManager)
- 映射器+还原器
warn
应用程序是否包括MapReduce
应用程序应用程序管理员
等等MapReduce1
(使用MR2库重新编译)作业是否由warn
以同样的方式,纱线的应用李>
MapReduce1
应用程序和warn
应用程序在warn
内部管理它们的方式上有什么区别提前感谢纱线只是一个集群管理器
- 首先,必须为纱线开发应用程序(如果尚未实施)。纱线支持的应用很少。如果您想在纱线上运行新应用程序,请参考
- 然后可以在纱线上运行相同的MR/Spark/Hama程序
- 跟踪资源消耗/可用性
- 作业生命周期管理——安排作业的各个任务,跟踪进度,为任务提供容错能力
请参阅有关架构和相关SE帖子的Apache文档页面: 纱线应用是否包括MapReduce应用 纱线支持
Mapreduce
应用程序。与Hadoop1.x不同,它还运行Spark作业
我是否应该像编写纱线应用程序一样编写代码,忘记驱动程序,创建纱线客户机、应用程序管理员等等
对。您应该忘记所有这些应用程序组件,然后编写应用程序。看一看样品
我仍然可以使用驱动程序+作业设置开发客户端类吗??MapReduce1(使用MR2库重新编译)作业是否由Thread以与Thread应用程序相同的方式管理
对。你能行。但是看看这个兼容性
MapReduce1应用程序和纱线应用程序在纱线内部管理它们的方式上有什么区别
请参阅此SE帖子:
这意味着如果我想开发MapReduce应用程序,我必须编写一个客户端和ApplicationMaster类?难道我不能像往常一样编写一个具有作业配置的驱动程序,以便将作业分配到集群吗?在MR1中开发的MR应用程序在纱线中工作时会发生什么情况?关于纱线如何在内部管理它们存在差异?纱线客户端和AM类已经为一些应用程序[1]()开发,如MR、BSP、Hama等。所以,你不需要。对于任何新类型,您都需要。