• 蒙开强
    2019-08-26
    老师,你好,你说的这些监控项,可以用监控工具演练一下么,不然只知道却没看到落地实现。
    
     8
  • r
    2019-08-24
    老师总结的真好。我有个疑问,没找到相关资料做支撑。就是一套kafka集群,最多能容纳多少个topic-partition,这个是集群规模有关吗,

    作者回复: 根据社区的报告,Kafka 1.1.0之后可以支持单集群20万个分区。和集群规模不能说没有关系,但其实和集群总的物理硬件资源有很大关系。

    
     4
  • 我已经设置了昵称
    2019-09-04
    要怎么看到JMX指标呢,能否讲下

    作者回复: 无论是Broker端还是Clients端启动前要先设置JMX_PORT,然后使用任何能够连接JMX MBean Server的工具或框架连接(如JConsole)就能看到了

    
     3
  • 追光者
    2019-08-30
    老师,您好,想请教一个关于  Metricbeat 采集 kafka 数据的问题:
    配置好 modules.d/kafka.yml 启动 metricbeat 采集不到数据,提示信息:
    2019-08-29T16:13:33.827+0800 INFO kafka/log.go:53 kafka message: Successful SASL handshake
    2019-08-29T16:13:33.828+0800 INFO kafka/log.go:53 SASL authentication successful with broker 10.162.7.2:9092:4 - [0 0 0 0]
    2019-08-29T16:13:33.828+0800 INFO kafka/log.go:53 Connected to broker at 10.162.7.2:9092 (unregistered)
    2019-08-29T16:13:33.832+0800 INFO kafka/log.go:53 Closed connection to broker 10.162.7.2:9092
    system 的可以采集到,请问这是什么原因呀
    配置文件:
    - module: kafka
    metricsets:
    - partition
    - consumergroup
    period: 10s
    hosts: ["10.162.3.90:9092"]
    client_id: xl
    retries: 3
    backoff: 250ms
    topics: []
    username: "admin"
    password: "admin"
    展开

    作者回复: 这里都是IINFO日志看不出有什么问题,有其他日志吗?

     1
     1
  • ykkk88
    2019-08-25
    有什么好的开源的监控工具么

    作者回复: 我觉得Kafka Manager就挺不错的

    
     1
  • wxr
    2019-08-24
    怎样比较好的监控消费延时呢

    作者回复: 这个取决于你对消费延时的定义。从Kafka的角度,当poll方法返回后,消息已经算是被消费了,但通常我们获取到消息后还要对消息进行处理,如果你认为处理完成后才算是消费就要加上这部分的时间,但处理逻辑、工具、方法都不尽相同,因此你需要自己来监控消息处理的总时间。

     4
     1
  • 外星人
    2019-08-24
    你好,单个topic可以支撑的最多partition个数多少啊?我们生产上有个topic超级大,占了整个集群的一半以上的流量,这种情况是需要拆分吗?

    作者回复: 如果性能okay而仅仅是你觉得不太好,那么我认为先不用拆分。单个topic最多能有多少partition没有定数,主要还是看底层物理资源。当然分区数过多,使得broker上平均分区数增加的确会降低Kafka的TPS。

    
     1
  • Rosy
    2019-12-23
    kafka会频繁地删掉broker,导致频繁地切换leader,这是什么情况呢

    作者回复: 能详细解释下”删掉broker”的含义吗?

    
    
  • 风中花
    2019-11-30
    老师你的公众号怎么找到呢

    作者回复: 大数据Kafka技术分享

    
    
  • frenco
    2019-11-08
    老师好, 请教个问题: 按您之前有个推荐的配置kafka内存的说法,一般堆内存配置6G就好了。 那新生代和老年代默认2:1 分配。 如果只需要6G的内存, 我们生产的机器一般都是64G以上内存, 那机器是不是有很大浪费呢。

    作者回复: 那就单台多broker吧,不过网卡最好万兆

    
    
  • 皇甫
    2019-11-04
    老师,您好,最近遇到一个实践问题,通过调用kafka manage提供的api获取topic的流入消息数量,有时候有延时,在生产者流量激增的情况下,api不能及时返回消息流入数量,想问下这是什么原因,有啥解决办法吗?谢谢

    作者回复: 不太清楚kafka manager API是怎么实现的。你可以用下jmxtool工具去实时监控下Kafka提供的JMX,看看是否有延迟呢?

    
    
  • godtrue
    2019-09-24
    感觉离开平台自己真的什么都不是,公司内部的监控挺全的,单机的CPU/硬盘/内存/网络/jvm等都有,也有针对方法级别的性能/可用率/调用次数,针对MQ有流入/流出/积压等,这里的每个监控工具都有专门的团队来负责,分工比较细,现在想一想业务开发,如果对业务不精通真是没有什么存在感和价值的。
    感觉监控最大的痛点是怎么获取到对应的监控信息,只要能获取监控信息,剩下的就是怎么聚合和汇总展示的问题了。
    
    
  • Geek_72a3d3
    2019-09-17
    “同时,Load 值一直在增加,也说明这台主机上的负载越来越大。”
    老师,您好,Load值好像是越来越小。??

    作者回复: 3个值的排序是过去1分钟,5分钟和15分钟,因此表明load越来越大

     1
    
  • given
    2019-08-29
    请教下老师,我们最近遇到一个监控问题,监控各个topic的消息堆积,发现如果业务方由于服务下线,不使用某个consume group了,结果这个group的消息堆积会一直增加,运维就会收到监控告警,但是运维并不好判断哪个group已经不使用了,这个能有什么自动化的手段吗

    作者回复: 如果group不使用了,它的状态就是nonactive了,一段时间之后Kafka会自动删除的它数据。如果判断状态的话,新一点版本的Kafka可以使用kafka-consumer-groups --describe --group *** 来查看group状态。

    
    
  • 13761642169
    2019-08-26
    确实很经典
    
    
  • 丰富
    2019-08-24
    请问老师,kafka支持snmp吗?

    作者回复: 不确定您指的支持是什么意思。Kafka有开源的Connect组件接收SNMP traps,但如果是指Kafka的请求协议的话,那么Kafka是自己设计的一套二进制协议,底层用TCP。没有用到SNMP

     1
    
  • 许童童
    2019-08-24
    老师总结得很好,跟着老师一起精进。
    
    
我们在线,来聊聊吧