Apache kafka 如何修复';Kafka偏移量提交在分区上失败:请求超时';

Apache kafka 如何修复';Kafka偏移量提交在分区上失败:请求超时';,apache-kafka,Apache Kafka,我突然在卡夫卡的制作中遇到了一些例外 错误[pool XX thread YY]org.apache.kafka.clients.consumer.internals.ConsumerCoordinator-[consumer clientId=someclientid,groupId=somegroup]在分区SomeTopic SomePartition上的偏移量SomeOffset提交失败:请求超时。 这发生了3.5秒,来自许多不同的服务(客户端)(不同的线程\不同的主题\不同的分区),

我突然在卡夫卡的制作中遇到了一些例外

错误[pool XX thread YY]org.apache.kafka.clients.consumer.internals.ConsumerCoordinator-[consumer clientId=someclientid,groupId=somegroup]在分区SomeTopic SomePartition上的偏移量SomeOffset提交失败:请求超时。
这发生了3.5秒,来自许多不同的服务(客户端)(不同的线程\不同的主题\不同的分区),而不仅仅是自我修复。。。 对于所有这些客户端,偏移提交配置是5秒自动提交

无法跟踪kafka broker日志中的任何内容,除了一个组(10个组中有此问题)的某些重新平衡权限,这在心脏跳动失败时是正常的,在metrics服务器中,我可以看到一些提交延迟峰值,我猜这是症状,在1个broker上有一些TCP峰值(3个组中有)

我怎样才能开始调查呢?什么会导致这样的问题?当这样的事情发生时,我应该去哪里看

在此附上一些图表的照片:

服务器3中的TCP峰值

提交延迟峰值

组同步

心跳