Apache kafka 卡夫卡能力规划
我的雇主有一个卡夫卡集群来处理有价值的数据。我们有没有办法知道我们的群集运行时的容量百分比?我们的群集能否处理更大的流量?如果一个节点发生故障,我们能存活一小时或一天吗?我不确定你的确切意思,所以我将采取广泛的方法 您所说的容量是指“我的卡夫卡集群会容纳我所有的日志吗?”。这是一个功能:Apache kafka 卡夫卡能力规划,apache-kafka,capacity-planning,Apache Kafka,Capacity Planning,我的雇主有一个卡夫卡集群来处理有价值的数据。我们有没有办法知道我们的群集运行时的容量百分比?我们的群集能否处理更大的流量?如果一个节点发生故障,我们能存活一小时或一天吗?我不确定你的确切意思,所以我将采取广泛的方法 您所说的容量是指“我的卡夫卡集群会容纳我所有的日志吗?”。这是一个功能: 主题的保留期 你的 卡夫卡消息的平均大小 您希望通过系统推送的消息量 您的复制因子 如果你有。另见: 如果您有一个2周的保留期,没有日志压缩(当一条消息消失时,它就消失了),没有日志压缩,并且在这两周内,您
- 主题的保留期
- 你的
- 卡夫卡消息的平均大小
- 您希望通过系统推送的消息量
- 您的复制因子
- 如果你有。另见:
- (我认为在这几年的过渡期内,这方面的变化不大)
- 你要多少钱
- 如果您的使用者组中有足够的使用者来处理所有分区
- 每个微服务处理需要多长时间
我希望这有帮助。不幸的是,表面上看,这是一个更广泛的问题。最终,它是数据管道中%磁盘空间、%CPU和%SLA的函数。。。这有时可以归结为一些独特的因素,比如您的消息大小,您是或想要运行的机器类型,以及您的微服务的速度。卡夫卡这项技术可以处理惊人的流量:LinkedIn不是一个小网站,互联网上一些流量最大的网站都在使用卡夫卡。理论上,一个构造良好的代理集群应该能够处理您向它抛出的任何东西。实际部分涉及到您的工作流、您的需求、您实际使用它做什么等等。我们的群集运行的容量百分比--听起来您需要硬件级别的适当监控解决方案,而不仅仅是Kafka JVM监控。您能否生存取决于主题复制因素(您没有提到),或者您的集群isI有多大?它有一个完整的普罗米修斯度量跟踪系统,跟踪通过JMX报告的所有卡夫卡度量,还使用普罗米修斯节点导出器跟踪系统度量,如CPU/RAM/磁盘使用等。你是说JMX监控而不是JVM监控吗?这是不是一个“合适的”监控解决方案?JMX是一种监控JVM的技术,所以这就是我的意思。Kafka占用CPU和磁盘资源,分配一些堆空间,并执行GC调用。。。如果不提供更多的inf,您在这里寻找的答案就不太清楚了