Hadoop RM报告负面资源使用情况
最近,我在Thread中遇到了一些资源分配问题(我的Hadoop MR应用程序无法分配新的容器,而集群几乎是免费的),并且我查看了RM的调度程序统计数据(http:///ws/v1/cluster/scheduler)如果某些资源具有负值:Hadoop RM报告负面资源使用情况,hadoop,yarn,resourcemanager,Hadoop,Yarn,Resourcemanager,最近,我在Thread中遇到了一些资源分配问题(我的Hadoop MR应用程序无法分配新的容器,而集群几乎是免费的),并且我查看了RM的调度程序统计数据(http:///ws/v1/cluster/scheduler)如果某些资源具有负值: <queue xsi:type="capacitySchedulerLeafQueueInfo"> <capacity>19.0</capacity> <usedCapacity&g
<queue xsi:type="capacitySchedulerLeafQueueInfo">
<capacity>19.0</capacity>
<usedCapacity>-69.52686</usedCapacity>
<maxCapacity>90.0</maxCapacity>
<absoluteCapacity>19.0</absoluteCapacity>
<absoluteMaxCapacity>90.0</absoluteMaxCapacity>
<absoluteUsedCapacity>0.0</absoluteUsedCapacity>
<numApplications>10</numApplications>
<queueName>default</queueName>
<state>RUNNING</state>
<resourcesUsed>
<memory>-152576</memory>
<vCores>-41</vCores>
</resourcesUsed>
<hideReservationQueues>false</hideReservationQueues>
<nodeLabels>*</nodeLabels>
<allocatedContainers>24</allocatedContainers>
<reservedContainers>0</reservedContainers>
<pendingContainers>0</pendingContainers>
<numActiveApplications>10</numActiveApplications>
<numPendingApplications>0</numPendingApplications>
<numContainers>-41</numContainers>
<maxApplications>1900</maxApplications>
<maxApplicationsPerUser>855</maxApplicationsPerUser>
<maxActiveApplications>102</maxActiveApplications>
<maxActiveApplicationsPerUser>10</maxActiveApplicationsPerUser>
<userLimit>10</userLimit>
...
</queue>
19
-69.52686
90
19
90
0
10
违约
跑步
-152576
-41
假的
*
24
0
0
10
0
-41
1900
855
102
10
10
...
从容量调度器POV可以吗?
我认为它可能表示保留的资源,但reservedContainers是0。您正在运行哪个版本的Hadoop?由于同步问题,可能会导致资源的负值,因此存在许多错误。看,我正在使用hadoop 2.6.0。感谢您指向hadoop的jira!您知道您的群集在没有重新启动的情况下运行了多长时间吗?如果有一段时间了,我猜这是一个已知的问题。