作者回复: 很好的建议👍🏻
作者回复: 非常正确,传统架构下要把这些能力串起来不是一件容易的事。K8s 实际上把这些问题都抽象成能力了,这些开箱即用的能力可以帮助我们构建弹性,高可用的业务系统。
作者回复: 是的,还可以结合 crontab。
作者回复: Node 节点动态扩容(cluster-autoscale)一般由云厂商直接实现,具体用法你可以看这个文档:https://github.com/kubernetes/autoscaler/tree/master/cluster-autoscaler
作者回复: 可以用 Liveness 探针来检查存活状态,如果业务无法返回 200 那么 K8s 会自动重启它。
作者回复: 这是一个很好的真实场景,你提到的做法可以缓解这个问题,更好的做法可能是结合 istio 配置熔断机制,也就是在业务高峰的时候保护后端服务,避免雪崩。比如一些网站在双11流量高峰的时候对于新的流量会直接提示人数过多,请稍后再试。 此外,还可以结合 HPA,配置低一点的阈值,在业务高峰来之前快速把副本数量拉高,如果是业务高低峰非常明显的业务,可以定时进行扩缩容。
作者回复: 正确
作者回复: 👍
作者回复: 感谢你的认可~
作者回复: 是的,还有一种是类似于云监控的产品也能做健康检查,不过这两种健康检查都不能和重启策略直接关键起来。