Kubernetes 普罗米修斯号运营者彻底摧毁了数字海洋上的整个库伯内特斯星系群

Kubernetes 普罗米修斯号运营者彻底摧毁了数字海洋上的整个库伯内特斯星系群,kubernetes,digital-ocean,prometheus,kubernetes-helm,prometheus-operator,Kubernetes,Digital Ocean,Prometheus,Kubernetes Helm,Prometheus Operator,我正试图用头盔在DOKS安装普罗米修斯操作员。我使用了本教程: 在安装舵图期间,我遇到了无法创建CRD的错误。然后我卸载了图表,执行了Helm部分的命令,无法从中创建CRD,然后安装了Helm chart。我在连接超时时出错,整个集群都崩溃了。我无法连接到它。 45分钟后,主节点激活,我删除了图表 我一直在寻找解决方案,结果发现:(我正在使用头盔3),但整个集群再次出现故障,几个小时后仍然无法工作 我假设这种情况与DigitalOcean的实施有关,但我不确定。您是在DigitalOcean服务

我正试图用头盔在DOKS安装普罗米修斯操作员。我使用了本教程:

在安装舵图期间,我遇到了无法创建
CRD
的错误。然后我卸载了图表,执行了Helm部分的命令,无法从中创建CRD,然后安装了Helm chart。我在连接超时时出错,整个集群都崩溃了。我无法连接到它。 45分钟后,主节点激活,我删除了图表

我一直在寻找解决方案,结果发现:(我正在使用头盔3),但整个集群再次出现故障,几个小时后仍然无法工作


我假设这种情况与DigitalOcean的实施有关,但我不确定。

您是在DigitalOcean服务器内部本地运行
helm install
,还是远程运行?如果是远程的,可能您遇到了一些连接问题,您可以测试监控服务器连接,或者尝试在服务器内部运行helm install。此外,您还可以在服务器端使用
tmux
,以避免在连接失败时丢失终端。@rabello远程,但DO cluster的图标是橙色而不是绿色,并且不会收集CPU、内存等指标。所以我不认为这是连接问题。听起来好像Digital Ocean的度量集合是基于Prometheus的,并且由于您的安装出现了问题,现有的度量设置已损坏。根据猜测,图表中的CRD是正常对象,不使用Helm的CRD管理,因此卸载图表会删除CRD,从而删除基于这些CRD的所有对象。正是因为避免了这种故障,Helm v3才改变了CRD处理。我不知道为什么这会影响集群的响应,因为这只会影响度量的收集。这就是为什么这是一个评论,而不是一个答案^_^