Hadoop RM报告负面资源使用情况

Hadoop RM报告负面资源使用情况,hadoop,yarn,resourcemanager,Hadoop,Yarn,Resourcemanager,最近,我在Thread中遇到了一些资源分配问题(我的Hadoop MR应用程序无法分配新的容器,而集群几乎是免费的),并且我查看了RM的调度程序统计数据(http:///ws/v1/cluster/scheduler)如果某些资源具有负值: <queue xsi:type="capacitySchedulerLeafQueueInfo"> <capacity>19.0</capacity> <usedCapacity&g

最近,我在Thread中遇到了一些资源分配问题(我的Hadoop MR应用程序无法分配新的容器,而集群几乎是免费的),并且我查看了RM的调度程序统计数据(http:///ws/v1/cluster/scheduler)如果某些资源具有负值:

 <queue xsi:type="capacitySchedulerLeafQueueInfo">
        <capacity>19.0</capacity>
        <usedCapacity>-69.52686</usedCapacity>
        <maxCapacity>90.0</maxCapacity>
        <absoluteCapacity>19.0</absoluteCapacity>
        <absoluteMaxCapacity>90.0</absoluteMaxCapacity>
        <absoluteUsedCapacity>0.0</absoluteUsedCapacity>
        <numApplications>10</numApplications>
        <queueName>default</queueName>
        <state>RUNNING</state>
        <resourcesUsed>
           <memory>-152576</memory>
           <vCores>-41</vCores>
        </resourcesUsed>
        <hideReservationQueues>false</hideReservationQueues>
        <nodeLabels>*</nodeLabels>
        <allocatedContainers>24</allocatedContainers>
        <reservedContainers>0</reservedContainers>
        <pendingContainers>0</pendingContainers>
        <numActiveApplications>10</numActiveApplications>
        <numPendingApplications>0</numPendingApplications>
        <numContainers>-41</numContainers>
        <maxApplications>1900</maxApplications>
        <maxApplicationsPerUser>855</maxApplicationsPerUser>
        <maxActiveApplications>102</maxActiveApplications>
        <maxActiveApplicationsPerUser>10</maxActiveApplicationsPerUser>
        <userLimit>10</userLimit>
        ...
  </queue>

19
-69.52686
90
19
90
0
10
违约
跑步
-152576
-41
假的
*
24
0
0
10
0
-41
1900
855
102
10
10
...
从容量调度器POV可以吗?
我认为它可能表示保留的资源,但reservedContainers是0。

您正在运行哪个版本的Hadoop?由于同步问题,可能会导致资源的负值,因此存在许多错误。看,我正在使用hadoop 2.6.0。感谢您指向hadoop的jira!您知道您的群集在没有重新启动的情况下运行了多长时间吗?如果有一段时间了,我猜这是一个已知的问题。