• 陈迪
    2022-02-25
    过载判断那里没理解。 按排队时间或者响应时间来判断很容易理解,但怎么变成下面变成“硬件指标”了,没搞懂这个逻辑。 “满载”指的又是啥

    作者回复: 排队时间和响应时间是从服务的角度来判断是否过载,如果从机器系统的角度来判断,那么就是内存使用率,对于内存,我们的满载可以定义内存使用率80%,也就是说内存使用率超过80%,系统就过载了。满载就是系统阈值,超过了就说明过载。

    共 2 条评论
    3
  • Bug Killer
    2022-03-25
    我们可以依据请求在队列中的平均等待时间来计算服务的负载 请求在队列中的等待时间怎么算

    作者回复: 这个是和实现方式相关的,如果内部实现是生产者消费者模型,可以通过埋点统计来实现,如果不是这种模型是不好统计的。

    
    1
  • 不吃辣👾
    2022-03-30
    一台虚拟机部署一个服务,虚拟机的硬件指标是不是可以代表服务负载问题?

    作者回复: 可以👍

    
    
  • peter
    2022-02-23
    请教老师两个问题: Q1:容器垂直扩容,升级的是节点资源,怎么图形中Pod变大了?(Pod图标变大应该是意味着Pod的资源变多了吧) Q2:如果不上云,扩容/缩容有框架吗?还是说需要自己开发? 如果上云,云会提供自动缩/扩容机制,对吗?

    作者回复: Q1:是的 Q2:上不去云都可以用K8S来自动扩容,只不过如果不上云,没有CA来扩容节点

    
    
  • 芋头
    2023-04-21 来自广东
    原则: 1.有状态的服务一般采用垂直扩容VPA(Vertical pod autoscale) 2.无状态的服务采用水平扩容HPA(horizon pod autoscale ) 3.节点资源不够时需要CA(cluster autoscale)
    
    1
  • Jxin
    2022-02-25
    1.文中漏了一个点。决策扩容的依据是什么? 没有pod可用这是一个结果。判断pod能否支撑当前请求,不能有没有其他pod可以,都没有创建新pod。这已经涉及自适应负载均衡了,而这个在高并发场景很难实现,感兴趣可以想想。 2.一年多没关注了,之前的解法是采用大集群走负载均衡而不是自适应负载均衡,最后基于定时的负载检测决策是否扩容。
    
    1