极客时间-轻松学习，高效学习-极客邦

陈迪
2022-02-25
过载判断那里没理解。按排队时间或者响应时间来判断很容易理解，但怎么变成下面变成“硬件指标”了，没搞懂这个逻辑。 “满载”指的又是啥
作者回复: 排队时间和响应时间是从服务的角度来判断是否过载，如果从机器系统的角度来判断，那么就是内存使用率，对于内存，我们的满载可以定义内存使用率80%，也就是说内存使用率超过80%，系统就过载了。满载就是系统阈值，超过了就说明过载。
共 2 条评论
3
Bug Killer
2022-03-25
我们可以依据请求在队列中的平均等待时间来计算服务的负载请求在队列中的等待时间怎么算
作者回复: 这个是和实现方式相关的，如果内部实现是生产者消费者模型，可以通过埋点统计来实现，如果不是这种模型是不好统计的。
1
不吃辣👾
2022-03-30
一台虚拟机部署一个服务，虚拟机的硬件指标是不是可以代表服务负载问题？
作者回复: 可以👍
peter
2022-02-23
请教老师两个问题： Q1：容器垂直扩容，升级的是节点资源，怎么图形中Pod变大了？（Pod图标变大应该是意味着Pod的资源变多了吧） Q2：如果不上云，扩容/缩容有框架吗？还是说需要自己开发？如果上云，云会提供自动缩/扩容机制，对吗？
作者回复: Q1：是的 Q2：上不去云都可以用K8S来自动扩容，只不过如果不上云，没有CA来扩容节点
芋头
2023-04-21 来自广东
原则： 1.有状态的服务一般采用垂直扩容VPA(Vertical pod autoscale) 2.无状态的服务采用水平扩容HPA(horizon pod autoscale ) 3.节点资源不够时需要CA（cluster autoscale)
1
Jxin
2022-02-25
1.文中漏了一个点。决策扩容的依据是什么？没有pod可用这是一个结果。判断pod能否支撑当前请求，不能有没有其他pod可以，都没有创建新pod。这已经涉及自适应负载均衡了，而这个在高并发场景很难实现，感兴趣可以想想。 2.一年多没关注了，之前的解法是采用大集群走负载均衡而不是自适应负载均衡，最后基于定时的负载检测决策是否扩容。
1