查找无法访问/停用的mesos从属代理

查找无法访问/停用的mesos从属代理,mesos,mesosphere,dcos,Mesos,Mesosphere,Dcos,我在aws ec2实例上部署了dcos群集,该实例有两个mesos从属代理。他们中很少有人意外地被终止。Mesos master将其标记为“无法访问”。我想将他们的状态从“不可访问”更改为“不可访问”。为此,DCO提供以下命令: dcos node decommission <mesos-id> dcos节点停用 然而,我无法找到无法访问的mesos代理的mesos id。无论是mesos master还是dc/osGUI/log,都不会显示这些节点的任何信息 我的问题是如何获得

我在aws ec2实例上部署了dcos群集,该实例有两个mesos从属代理。他们中很少有人意外地被终止。Mesos master将其标记为“无法访问”。我想将他们的状态从“不可访问”更改为“不可访问”。为此,DCO提供以下命令:

dcos node decommission <mesos-id>
dcos节点停用
然而,我无法找到无法访问的mesos代理的mesos id。无论是
mesos master
还是
dc/os
GUI/log,都不会显示这些节点的任何信息

我的问题是如何获得所有无法访问(或停用)的mesos从属代理的列表


非常感谢。

要获取标记为无法访问的代理的历史记录,请使用以下命令:

grep unreachable /var/log/mesos/*.INFO.*


但是,如果您只想重置web ui中报告的指标,则需要重新启动mesos主服务(查看)

谢谢您的回答,这样我就可以获取无法访问的代理。但是,当我重新启动decos mesos主服务时,我丢失了所有日志文件,即使我没有任何目录“var/log/dcos”或“var/log/mesos”。我的基本目标是从主注册表中删除无法访问的代理,以便让主注册表知道这些代理将永久消失。这方面有什么帮助吗?请使用此API:或与Dcos CLI配合使用:
gawk 'match($0, /.*Marking agent (.*) \(.*\) unreachable.*/, a) {print a[1]}' /var/log/mesos/*.INFO.*|sort|uniq