极客时间-轻松学习，高效学习-极客邦

Camera
2023-02-06 来自广东
秦老您好！想请教您两个问题： 1、项目要求需要做一套运维监控，想基于Prometheus来二开，请问作为产品（对运维没有相关经验），需要从哪方面下手来做产品设计呢？ 2、运维系统的指标很多是需要通过配置文件配置，是否可将它可视化呢？感谢老师指导一二！
作者回复: 1，从需求出发，先去访谈你的需求方 2，可以试试 github.com/ccfos/nightingale 这个项目，把告警规则、记录规则都可视化管理了
2
peter
2023-02-06 来自北京
请教老师几个问题： Q1：怎么用 increase 函数计算慢查询的数量 Q2：MySQL最大连接数在生产环境中一般设置为多大？ Q3：Innodb_buffer_pool_reads 是从缓存读吗？ “reads 这个指标除以 read_requests 就得到了穿透比例”，从这句话看，此指标不是从缓存中读，而是从库里直接读（即从硬盘读）。但从名字看，似乎Innodb_buffer_pool_reads 应该是从缓存读。 Q4：中心化探测，categraf是只探测本身机器上的MySQL吗？还是说既探测本机上的MySQL也探测其他机器上的MySQL？ Q5：生产环境中MySQL不用docker或k8s吗？这一句“因为生产环境里 MySQL 一般很少放到容器里跑”，从这句看，似乎生产环境中MySQL是手动部署，不用docker 或k8s，是吗？ Q6：本专栏有学习微信群吗？
作者回复: 前两个问题和另一个同学的重复了，你翻一下吧。 3，这个指标表示从硬盘读 4，中心化探测就是找一个机器部署categraf，用这个categraf探测你们公司的所有mysql实例 5，我看到的实践是很少放容器里，也有放的 6，专栏介绍页面，有高亮文字提示
2
乔纳森
2023-02-06 来自广东
老师您好，怎么根据黄金指标计算组件的SLI呢？以MySQL为例
作者回复: 这是个好问题。网上没看到讨论。普通web服务的SLI通常制定为可用性、延迟、成功率。对于mysql而言，可用性显然也是一个重要的SLI。延迟，取决于sql复杂度，mysql自身倒是难以控制，没法作为一个SLI，不具有mysql建设指导意义。成功率，典型的是客户端发的sql本身有问题所以报错（非mysql问题），连接数过多所以报错，最大连接数如果设置不合理是mysql的锅，如果设置合理了，还是连接数过多，就是上层业务的锅了。这个指标可以作为SLI，但具体故障定责的时候，还得case by case 的看。另外，mysql是存储数据的，自身还要保证数据可靠性。可靠性应该要定指标。综上，对mysql而言，最靠谱的SLI我感觉是可用性和可靠性。
共 2 条评论
1
Roy Liang
2023-02-15 来自广东
现在云时代了，最大连接数、innodb buffer pool大小等该调优的参数云产品都替我们做了，这种情况下我们需要重点关注哪些指标呢？
作者回复: 文章中还提到了一些其他的项，比如slow_query、吞吐量之类的，监控大盘里配置的那些项也需要挨个梳理一下
123
2023-02-14 来自浙江
请教老师一个问题，如果一个数据库服务里面有多个实例，在自定义业务指标时如何去制定对应的实例，并书写sql
作者回复: mysql是单实例的，多个实例是啥意思？通常要做区分度，都是通过附加标签的方式哈。比如 select 'n9e' as service, xxx from xx 这里就会在结果列里出现service列，value是n9e，此时就可以把service列设置为标签列
大叮当
2023-02-06 来自中国香港
老师您好，请教两个问题： Q1：怎么用 increase 函数计算慢查询的数量？ Q2：MySQL最大连接数在生产环境中一般设置为多大？
作者回复: 1，前面介绍过promql的使用，慢查询的指标外层包一个increase函数，指定一个时间段，比如1m，就可以计算1m内的慢查询增量 2，http://www.mysqlcalculator.com/ 可以用这个工具来测算，连接越多，占用的内存越大。或者就简单点，直接把max_connections设置的巨大，然后观察其他指标，比如cpu、内存之类的在达到最大连接数之前肯定就先有问题了
橙汁
2023-02-06 来自北京
这段话 “表里的时间度量指标都是以皮秒为单位。”是毫秒吧，另外学到不少知识相当于拿四个指标以mysql为案例讲了下监控思路，最后还给出实际解决方案夜莺监控可直接用，思路清晰牛逼。以前：监控就那些玩意基础层有云都是云不用做什么现在：思考的更多业务层也大有可为
作者回复: 是皮秒哈，没错的
共 2 条评论
Geek_be4f4d
2023-06-07 来自北京
老师您好，脑图中的performance_schema 中的schema单词是否拼写错误了？
时过境迁᭄ꦿ
2023-04-07 来自广东
大佬们，这个监控mysql只在Categraf 针对 MySQL 的采集插件配置，在 conf/input.mysql/mysql.toml这个文件加上就好了吗，不能用Grafana
Goal
2023-02-16 来自北京
这个都是夜莺为例吗