30 | 分布式高可用之故障隔离:当断不断,反受其乱
聂鹏程
该思维导图由 AI 生成,仅供参考
你好,我是聂鹏程。今天,我来继续带你打卡分布式核心技术。
在前面两篇文章中,我带你一起学习了分布式系统高可靠的关键技术,包括分布式负载均衡和流量控制。除了高可靠,在实际生产中,分布式系统的高可用问题也极其重要。
比如,在双十一的抢购高峰期,如果分布式系统不能满足高可用的特性,那么当大量用户同时抢购时就可能导致系统崩溃,无法提供服务,导致大量用户流失。
因此,在接下来的两篇文章,我将从故障隔离和恢复机制这两项关键技术入手,和你一起学习如何保证分布式系统的高可用。
今天,我们就先一起打卡分布式高可用中的故障隔离吧。
什么是故障隔离?
从字面意思来看,故障隔离就是,把故障通过某种方式与其他正常模块进行隔离,以保证某一模块出现故障后,不会影响其他模块。
其实,我们生活有很多故障隔离的例子,比如交通。一辆车就类似于分布式系统中的一个模块,当一辆车在高速公路上出现故障后,我们通常会将其停靠在紧急车道,或者在其前后设置故障指示牌,以防止其他车辆与其相撞,引起更大的交通事故。这种将故障车辆停靠在路边紧急车道或设置故障指标牌的方法,就是一种故障隔离。
现在我们回到分布式系统,故障隔离,就是采用一定的策略,以实现当某个模块故障时,不会影响其他模块继续提供服务,以保证整个系统的可用性。所以说,故障隔离,可以避免分布式系统出现大规模的故障,甚至是瘫痪,降低损失。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
分布式系统的故障隔离是确保系统高可用性的关键技术之一。故障隔离通过将故障与其他正常模块隔离,以保证某一模块出现故障后不会影响其他模块,从而降低系统瘫痪的风险。文章介绍了故障隔离的概念和常见策略,包括线程级隔离和进程级隔离,以及资源隔离。线程级隔离通过使用不同的线程池处理不同的请求任务,实现故障的隔离;而进程级隔离则将系统按功能分为不同的进程,分布到相同或不同的机器中,以实现故障隔离。资源隔离则将分布式系统的所有资源分成几个部分,每部分资源负责一个模块,从而避免资源争夺,提高系统性能。微服务框架中的容器化技术也是一种资源隔离策略,通过限制容器使用的资源来实现资源隔离,提升系统性能。除了资源隔离,还介绍了用户级别的故障隔离策略,如数据分片和负载均衡。这些策略对于分布式系统的高可用性保障具有重要意义。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《分布式技术原理与算法解析》,新⼈⾸单¥59
《分布式技术原理与算法解析》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(15)
- 最新
- 精选
- 阿卡牛划重点:故障隔离更多的是从事前预防的角度下手2019-12-108
- Harvey这节课不应该叫故障隔离,应该叫避免单点故障2020-02-093
- Jackey判断一个系统是否健康就是我们平时监控的一些指标吧,cpu、内存利用率、磁盘空间、io吞吐量,Java服务的话还要加上gc的相关信息,最后还有对网络的检查。2019-12-0613
- 张俊东其实可以再介绍下熔断机制2020-10-051
- leslie不同层次使用的隔离不同:中间件存储通常都是有MQ+DB组成,MQ用的是进程隔离,DB用的则是资源隔离,整套系统针对不同应用使用的隔离级是不同的。 通过今天的学习发现原来隔离梳理清楚是如此的复杂,一套性能和稳定性都不错的分布式系统其实一点都不容易。谢谢老师的教诲。2019-12-061
- 阿卡牛服务调用时长分布 服务的 TOP N 视图 数据库操作关联 服务资源跟踪2019-12-061
- 黄骏那磁盘亚健康和网络亚健康的隔离策略至少是进程级别的隔离了,可能是机房或者数据中心级别。2022-05-09
- cpzhao衡量一个服务的故障指标,一般是服务的可用性来衡量,例如服务的正常请求数/总请求数。当然这个指标也要考虑分配给这个服务的资源(cpu、内存等)。 所以我觉得系统故障的指标监控,需要坚持占用的cpu、内存、系统的业务响应成功率。2020-03-011
- 钱可用率2020-02-20
- Dale1、基础监控查看,例如cpu、内存、网络占用率 2、业务监控,通过定期检查服务状态,2020-01-20
收起评论