12|网络监控:如何监控网络链路和网络设备?
网络链路监控
ICMP 探测
- 深入了解
- 翻译
- 解释
- 总结
本文深入介绍了网络监控的关键技术和实践方法,主要包括网络链路监控和网络设备监控。在网络链路监控方面,文章详细介绍了使用Categraf进行ICMP、TCP和HTTP探测的配置方式,以及相关指标的监控方法。对于网络设备监控,文章提到了通过SNMP获取指标和利用SNMP Trap进行故障分析的方法。通过具体的配置示例和技术原理,为读者提供了实用的网络监控方法和工具,有助于他们更好地监控和管理网络基础设施。文章还介绍了SNMP指标获取方式和SNMP Trap的相关技术方案。总的来说,本文内容丰富,涵盖了网络监控的多个方面,为读者提供了全面的了解和实践指导。
《运维监控系统实战笔记》,新⼈⾸单¥59
全部留言(14)
- 最新
- 精选
- dobbysnmp结果的解析太繁琐了,纯纯体力活,开源根本没什么好用的库
作者回复: 的确很恶心,不过,如果大家能一起贡献采集配置就好了,就能很快攒起来各种型号设备的采集能力
2023-02-03归属地:四川32 - hshopeful老师有两个问题请教下: 1、telegraf 支持 snmp_trap,catagraf 没有支持的原因是什么呢?难点主要是啥? 2、这节课介绍的插件,telegraf 中都有,想请问下 catagraf 的优势是什么呢?
作者回复: 1,Categraf还没有精力做trap 2,在前面agent选型的章节,介绍过哈。除了前面章节介绍的,另外就是categraf支持metrics、logs、traces三大支柱的数据采集,集成了mtail,改良了mysql采集,改良了system采集,增加了几个Telegraf不支持的plugin,各有优劣吧
2023-02-03归属地:湖北1 - zdyang交换机监控还有一种方式是通过telemetry,这是华为的介绍https://support.huawei.com/enterprise/zh/doc/EDOC1000173014/165fa2c8?idPath=24030814|9856750|250987487|22896249|19896202
作者回复: 是的,这个更实时,新设备越来越多支持 Telemetry 了
2023-10-05归属地:上海 - kobe## Optional substring match in body of the response (case sensitive) expect_response_substring = "ok" ## Optional expected response status code. expect_response_status_code = 200 我这里如果这样配了 那指标的值是什么样的呢
作者回复: 核心关注 http_response_result_code 指标,通过 ./categraf --test --inputs http_response 可以看到。这个 http_response_result_code 指标如果是 0,就表示一切正常,如果非 0,就表示异常,不同的非 0 值代表不同的含义,具体可以参考:https://github.com/flashcatcloud/categraf/tree/main/inputs/http_response 指标体系里,仅仅使用不同的 value 呈现错误会有些不易读,也可以尝试事件监控的方式,参考 catpaw 的逻辑:https://mp.weixin.qq.com/s/Y-KipuKZxVn8o-NR6-ZBZg
2023-06-27归属地:浙江3 - Gong老师好,请教一下我想监控各终端和服务器的交互流量,有什么办法吗?服务器接的终端数量一千台左右。
作者回复: 一般监控网卡流量就可以了
2023-02-16归属地:山东 - F0RWARD老师,catagraf采集的网卡流量是32位的,还是64位的?当流量超过1G时,32位的数据会不准确
作者回复: 采集的监控数据都是 float64
2023-02-10归属地:北京 - MiraClei请教下载服务器离线状态下,categraf启动会频繁重启,报错信息是请求223.5.5.5,但服务器无法联网,这种情况下是如何解决?
作者回复: config.toml 里的 hostname 配置,不要写 $ip,如果写 $ip 就自动探测本机IP,自动探测的时候会请求223.5.5.5
2023-02-08归属地:北京 - 戒贪嗔痴最后一张图,最常使用的协议是:v2c?还是V2
编辑回复: 感谢反馈,已经更正了
2023-02-05归属地:浙江 - lei请教一下,平时的自定义服务数量非常多,每个服务又会对应多个进程或实例,每个进程会对应多线程,这种情况有什么好的方法监控服务吗?
作者回复: 监控服务,就看服务对外提供的服务质量,比如web服务就看可用性、延迟、错误率等,是有方法论的,可以参考第9讲。
2023-02-05归属地:浙江 - peter请问:ping一个机器会占用多少文件句柄?
作者回复: 1个
2023-02-03归属地:北京2