如何发现SOLR的根本原因;“名称或服务未知”;在Kubernetes中重新索引集合时发生异常?
有一个两节点的裸机Kubernetes集群,其中部署了80个Solr云节点 我希望移动一个现有的集合,大约有20亿。使用Solr Stream REINDEX collection命令将文档复制到另一个集合 成功重新编制约1百万N的索引后。不同Solr节点多次引发异常“java.net.UnknownHostException:v1-Solr-xx.v1-Solr-headless.default:名称或服务未知”以及与IO通信相关的其他异常 Kubernetes CoreDNS和Flannel pods的调试输出不会显示任何可疑消息以开始发现根本原因 我改变了各种Java设置和堆限制(包括将Solr Jetty和Solr套接字超时增加到300秒,将G1GC垃圾收集器更改为ZGC,将堆大小从2Gb更改为6Gb)。在这些情况下,唯一的结果是——在与DNS的连接过程中出现额外的超时异常(固定的持续时间为15秒,不管超时值如何) 所以,我想知道有没有其他方法来收集信息,以发现Solr这种奇怪行为的原因如何发现SOLR的根本原因;“名称或服务未知”;在Kubernetes中重新索引集合时发生异常?,kubernetes,solrcloud,Kubernetes,Solrcloud,有一个两节点的裸机Kubernetes集群,其中部署了80个Solr云节点 我希望移动一个现有的集合,大约有20亿。使用Solr Stream REINDEX collection命令将文档复制到另一个集合 成功重新编制约1百万N的索引后。不同Solr节点多次引发异常“java.net.UnknownHostException:v1-Solr-xx.v1-Solr-headless.default:名称或服务未知”以及与IO通信相关的其他异常 Kubernetes CoreDNS和Flannel