• 吃饭饭
    2019-12-02
    监控手段还是不少的,Grafana ,Skywalking,Prometheus 等, 另外还可以结合Nginx、 Flume 、Kafka 、ELK 等日志收集做自己的系统分析
    
     6
  • 无形
    2019-12-02
    我们之前自己做的监控主要有两方面的,一个是关键接口nginx日志,主要是状态码,运维收集之后扔到kafka,我们从kafka消费,聚合之后扔到influxdb,后来influxdb内存大,又太慢,又换成了clickhouse,还有一部分是应用层的错误日志,按照一定的频次控制,报警到钉钉群里处理
    
     4
  • 飞翔
    2019-12-02
    系统硬件指标用zabbix监控,接口响应,慢sql等我们是通过cat监控的
    
     3
  • 刺猬
    2019-12-02
    这里只提到了软件监控,硬件一般有什么好的监控方式

    作者回复: open falcon

    
     1
  • 👽
    2020-01-02
    个人理解:
    服务端监控主要内容,
    1 关注性能指标,
    2 存储服务端日志情况(采用消息队列),
    3 服务端指标展示。

    作者回复: 其实我觉得很重要的是依赖服务和资源的监控

    
    
  • longslee
    2019-12-10
    打卡。老师,请教下,在启动 Java 程序的时候,是不是应该养成暴露 jmx 的习惯呢

    作者回复: 一般如果做中间件的话,是需要的

    
    
  • 张德
    2019-12-05
    这个客户端监控就算是BAT其实做的也不是很好 以前有一阶段 手机淘宝某个版本的商品页的收藏小星星 无论如何都不能加入收藏夹。。。
    
    
  • 小可
    2019-12-03
    近一年一直在做运维监控系统的工作,从脚本+自研agent到zabbix + logstash,监控服务端消息队列+聚合计算程序。虽然满足需求,但节点多,指标多时,zabbix对应的数据库负载过高,logstash也太重太吃节点性能,当时选型时太就感觉都太重了,但上层定的没办法。现在已经不做这块了,听说又要换方案😂

    作者回复: 选型方案是可以慢慢演进的~

    
    
  • 阿卡牛
    2019-12-02
    有通用开源的agent推荐吗?还是建议每种组件都有自己弄个agent?

    作者回复: falcon有很多agent的

     1
    
  • PatHoo
    2019-12-02
    CNCF Prometheus

    作者回复: 云原生时代的监控系统组件

    
    
  • 白马度和
    2019-12-02
    请问agent是一个中间件件还是?

    作者回复: 是一个开源或者自研的程序

    
    
  • 峰
    2019-12-02
    怎么没提到Skywalking
    
    
我们在线,来聊聊吧