Hadoop mapred.job.queue.name的用例

Hadoop mapred.job.queue.name的用例,hadoop,mapreduce,cloudera,hortonworks-data-platform,Hadoop,Mapreduce,Cloudera,Hortonworks Data Platform,使用map reduce作业队列的实际用例是什么,即mapred.job.queue.name属性的值。我看到default始终用作值。mapred.job.queue.name是用于将作业分配给特定队列的名称。默认情况下,所有作业都进入“默认”队列。但是,可以创建分层队列。比如root、root.q1、root.q1.q1a等等。 这些队列中的每一个都可以有自己的属性集,以确保一定的优先级 一个真实的场景是,当您有多个涉众要求提供关于同一组基础设施的报告时。例如,在我的工作场所,我们有一位数据

使用map reduce作业队列的实际用例是什么,即
mapred.job.queue.name
属性的值。我看到
default
始终用作值。

mapred.job.queue.name是用于将作业分配给特定队列的名称。默认情况下,所有作业都进入“默认”队列。但是,可以创建分层队列。比如root、root.q1、root.q1.q1a等等。 这些队列中的每一个都可以有自己的属性集,以确保一定的优先级

一个真实的场景是,当您有多个涉众要求提供关于同一组基础设施的报告时。例如,在我的工作场所,我们有一位数据科学家试图开展各种研究工作,客户支持团队寻找各种每日和每周数据,然后是支持日常业务的实际工作。基础设施的核心应该是能够支持最好的功能。 拥有具有不同优先级的各种队列只会让Hadoop很容易决定处理器可用时下一步要做什么,或者可以使用多少


所以数据科学家将分配给“数据分析师”队列,营销团队将分配给“营销”队列。可以根据一天中的时间更改队列的优先级。

Map/Reduce系统始终支持至少一个名称为默认值的队列。因此,此参数的值应始终包含默认字符串。Hadoop中支持的一些作业调度器(如容量调度器)支持多个队列。如果正在使用这样的计划程序,则必须在此处指定已配置队列名称的列表。定义队列后,用户可以使用作业配置中的属性名称mapred.job.queue.name将作业提交到队列。可以有一个单独的配置文件,用于配置由调度程序管理的这些队列的属性。请参阅计划程序的文档以了解有关相同的信息


参考:

+1所以我认为“优先化”是用例之一。除了优先级,它还定义了执行顺序。因此,如果队列中有两个作业。在Job1完成或Job1中没有任何东西可以使用可用的处理器之前,Job2将开始工作。您对通过队列控制安全性有何见解?只有安全性方面,我可以看到,您可以以这样的方式配置,来自用户A的作业将永远转到QueueA,并且来自用户B的作业将永远转到QuealeB……如果您想将其视为任何级别的安全性。此外,用户A可能只能访问队列A。。。