极客时间-轻松学习，高效学习-极客邦

蒙开强

2019-08-26

老师，你好，你说的这些监控项，可以用监控工具演练一下么，不然只知道却没看到落地实现。



 8
r

2019-08-24

老师总结的真好。我有个疑问，没找到相关资料做支撑。就是一套kafka集群，最多能容纳多少个topic-partition，这个是集群规模有关吗，

作者回复: 根据社区的报告，Kafka 1.1.0之后可以支持单集群20万个分区。和集群规模不能说没有关系，但其实和集群总的物理硬件资源有很大关系。



 4
我已经设置了昵称

2019-09-04

要怎么看到JMX指标呢，能否讲下

作者回复: 无论是Broker端还是Clients端启动前要先设置JMX_PORT，然后使用任何能够连接JMX MBean Server的工具或框架连接（如JConsole）就能看到了



 3
追光者

2019-08-30

老师，您好，想请教一个关于 Metricbeat 采集 kafka 数据的问题：
配置好 modules.d/kafka.yml 启动 metricbeat 采集不到数据，提示信息：
2019-08-29T16:13:33.827+0800 INFO kafka/log.go:53 kafka message: Successful SASL handshake
2019-08-29T16:13:33.828+0800 INFO kafka/log.go:53 SASL authentication successful with broker 10.162.7.2:9092:4 - [0 0 0 0]
2019-08-29T16:13:33.828+0800 INFO kafka/log.go:53 Connected to broker at 10.162.7.2:9092 (unregistered)
2019-08-29T16:13:33.832+0800 INFO kafka/log.go:53 Closed connection to broker 10.162.7.2:9092
system 的可以采集到，请问这是什么原因呀
配置文件：
- module: kafka
metricsets:
- partition
- consumergroup
period: 10s
hosts: ["10.162.3.90:9092"]
client_id: xl
retries: 3
backoff: 250ms
topics: []
username: "admin"
password: "admin"

展开

作者回复: 这里都是IINFO日志看不出有什么问题，有其他日志吗？

 1

 1
ykkk88

2019-08-25

有什么好的开源的监控工具么

作者回复: 我觉得Kafka Manager就挺不错的



 1
wxr

2019-08-24

怎样比较好的监控消费延时呢

作者回复: 这个取决于你对消费延时的定义。从Kafka的角度，当poll方法返回后，消息已经算是被消费了，但通常我们获取到消息后还要对消息进行处理，如果你认为处理完成后才算是消费就要加上这部分的时间，但处理逻辑、工具、方法都不尽相同，因此你需要自己来监控消息处理的总时间。

 4

 1
外星人

2019-08-24

你好，单个topic可以支撑的最多partition个数多少啊？我们生产上有个topic超级大，占了整个集群的一半以上的流量，这种情况是需要拆分吗？

作者回复: 如果性能okay而仅仅是你觉得不太好，那么我认为先不用拆分。单个topic最多能有多少partition没有定数，主要还是看底层物理资源。当然分区数过多，使得broker上平均分区数增加的确会降低Kafka的TPS。



 1
Rosy

2019-12-23

kafka会频繁地删掉broker，导致频繁地切换leader，这是什么情况呢

作者回复: 能详细解释下”删掉broker”的含义吗？




风中花

2019-11-30

老师你的公众号怎么找到呢

作者回复: 大数据Kafka技术分享




frenco

2019-11-08

老师好，请教个问题：按您之前有个推荐的配置kafka内存的说法，一般堆内存配置6G就好了。那新生代和老年代默认2：1 分配。如果只需要6G的内存，我们生产的机器一般都是64G以上内存，那机器是不是有很大浪费呢。

作者回复: 那就单台多broker吧，不过网卡最好万兆




皇甫

2019-11-04

老师，您好，最近遇到一个实践问题，通过调用kafka manage提供的api获取topic的流入消息数量，有时候有延时，在生产者流量激增的情况下，api不能及时返回消息流入数量，想问下这是什么原因，有啥解决办法吗？谢谢

作者回复: 不太清楚kafka manager API是怎么实现的。你可以用下jmxtool工具去实时监控下Kafka提供的JMX，看看是否有延迟呢？




godtrue

2019-09-24

感觉离开平台自己真的什么都不是，公司内部的监控挺全的，单机的CPU/硬盘/内存/网络/jvm等都有，也有针对方法级别的性能/可用率/调用次数，针对MQ有流入/流出/积压等，这里的每个监控工具都有专门的团队来负责，分工比较细，现在想一想业务开发，如果对业务不精通真是没有什么存在感和价值的。
感觉监控最大的痛点是怎么获取到对应的监控信息，只要能获取监控信息，剩下的就是怎么聚合和汇总展示的问题了。




Geek_72a3d3

2019-09-17

“同时，Load 值一直在增加，也说明这台主机上的负载越来越大。”
老师，您好，Load值好像是越来越小。？？

作者回复: 3个值的排序是过去1分钟，5分钟和15分钟，因此表明load越来越大

 1


given

2019-08-29

请教下老师，我们最近遇到一个监控问题，监控各个topic的消息堆积，发现如果业务方由于服务下线，不使用某个consume group了，结果这个group的消息堆积会一直增加，运维就会收到监控告警，但是运维并不好判断哪个group已经不使用了，这个能有什么自动化的手段吗

作者回复: 如果group不使用了，它的状态就是nonactive了，一段时间之后Kafka会自动删除的它数据。如果判断状态的话，新一点版本的Kafka可以使用kafka-consumer-groups --describe --group *** 来查看group状态。




13761642169

2019-08-26

确实很经典




丰富

2019-08-24

请问老师，kafka支持snmp吗？

作者回复: 不确定您指的支持是什么意思。Kafka有开源的Connect组件接收SNMP traps，但如果是指Kafka的请求协议的话，那么Kafka是自己设计的一套二进制协议，底层用TCP。没有用到SNMP

 1


许童童

2019-08-24

老师总结得很好，跟着老师一起精进。



