37 | SaaS项目healthchecks.io的背景和架构（下）-分布式系统案例课-极客时间

分布式系统案例课

杨波

前携程 / 拍拍贷技术总监，微服务技术专家

11809 人已学习

新⼈⾸单¥59

课程目录

已完结/共 66 讲

第一章课程介绍 (2讲)



01 | 课程介绍

时长 09:20

02 | 内容综述

时长 04:42

第二章如何设计一个分布式计数服务 - 系统设计面试案例 (7讲)



时长 13:13

时长 14:05

时长 12:23

时长 04:09

时长 02:35

时长 03:02

时长 09:28

第三章如何设计一个简化版的Kafka消息系统 - 拍拍贷PMQ设计演进案例 (8讲)



时长 16:45

时长 14:21

时长 14:07

时长 10:10

时长 06:26

15 | Kafka的动态重平衡是如何工作的？（上）

时长 08:27

16 | Kafka的动态重平衡是如何工作的？（下）

时长 01:57

17 | 消息队列设计和治理最佳实践

时长 05:32

第四章如何解决微服务的数据一致性和事务问题 (13讲)



18 | 第四章目录和大纲

时长 05:39

19 | 微服务的四大技术难题是什么？

时长 06:16

20 | 如何解决微服务的数据一致性分发问题？

时长 25:10

21 | 如何解决微服务的数据聚合Join问题？

时长 14:34

22 | 如何解决微服务的分布式事务问题？（上）

时长 13:39

23 | 如何解决微服务的分布式事务问题？（下）

时长 13:48

24 | 阿里分布式事务中间件Seata解析

时长 15:16

25 | Uber微服务编排引擎Cadence解析

时长 18:30

26 | 如何理解Uber Cadence的架构设计？

时长 18:12

27 | 如何实现遗留系统的解耦拆分？

时长 08:10

28 | 拍拍贷系统拆分项目案例

时长 09:31

29 | CQRS/CDC技术在Netflix的实践

时长 09:01

30 | 第四章总结

时长 06:02

第五章如何设计一个高并发无状态的会话缓存服务 - 携程SessionServer案例 (5讲)



31 | SessionServer项目背景

时长 18:31

32 | 总体架构设计

时长 21:31

33 | 如何设计一个高性能基于内存的LRU Cache？

时长 18:19

34 | 如何设计一个高性能大容量持久化的ConcurrentHashmap？

时长 08:27

35 | 设计评估和总结

时长 10:16

第六章系统设计综合案例 - SaaS服务healthchecks.io的设计 (6讲)



36 | SaaS项目healthchecks.io的背景和架构（上）

时长 15:42

37 | SaaS项目healthchecks.io的背景和架构（下）

时长 11:28

38 | 如何设计一个轻量级的基于DB的延迟任务队列？

时长 11:58

39 | 如何设计一把轻量级的锁？

时长 10:13

40 | 如何设计一个分布式限流系统？

时长 19:49

41 | 如何设计一个分布式TopK系统实现实时防爬虫？

时长 13:31

第七章如何实现精细化服务治理 - 服务网格技术ServiceMesh解析 (10讲)



42 | 第七章目标和大纲

时长 03:17

43 | 为什么说ServiceMesh是微服务的未来(上)

时长 07:20

44 | 为什么说ServiceMesh是微服务的未来(下)

时长 14:30

45 | 解析Envoy Proxy(上)

时长 08:08

46 | 解析Envoy Proxy(下)

时长 14:32

47 | Envoy在Lyft的实践

时长 15:01

48 | 解析Istio

时长 13:28

49 | K8s Ingress、Istio Gateway和API Gateway该如何选择？(上)

时长 13:24

50 | K8s Ingress、Istio Gateway和API Gateway该如何选择？(下)

时长 07:19

51 | Spring Cloud、K8s和Istio该如何集成？

时长 12:05

第八章大型网站架构演进案例 (8讲)



52 | 第八章目标和大纲

时长 04:05

53 | 拍拍贷案例：大型网站架构是如何演进的？

时长 14:18

54 | 最小可用架构：Minimum Viable Architecture（上）

时长 15:39

55 | 最小可用架构：Minimum Viable Architecture（下）

时长 16:33

56 | 如何构建基于OAuth2/JWT的微服务架构？（上）

时长 12:25

57 | 如何构建基于OAuth2/JWT的微服务架构？（下）

时长 17:14

58 | 拍拍贷案例：如何实现数据中心机房的迁移？

时长 05:09

59 | 携程/Netflix案例：如何实现同城双活和异地多活？

时长 09:36

第九章架构师成长之道 (6讲)



60 | 第九章大纲

时长 01:53

61 | 学习开源项目的6个层次和8种方法（上）

时长 10:30

62 | 学习开源项目的6个层次和8种方法（中）

时长 14:32

63 | 学习开源项目的6个层次和8种方法（下）

时长 12:28

64 | 百万年薪架构师是如何炼成的？

时长 08:33

65 | 解读一份大厂的研发岗职级体系

时长 09:52

第十章课程回顾&结课测试 (1讲)



66 | 结课测试&结束语

时长 07:33



分布式系统案例课



留言





沉浸
阅读





手机端



回顶部

当前播放: 37 | SaaS项目healthchecks.io的背景和架构（下）

00:00 / 00:00

高清

高清

1.0x

2.0x
1.5x
1.25x
1.0x
0.75x
0.5x

网页全屏

全屏

00:00

付费课程，可试看



01 | 课程介绍

02 | 内容综述

03 | 需求收集和总体架构设计

04 | 存储设计

05 | 计数服务设计（上）

06 | 计数服务设计（下）

07 | 查询服务设计

08 | 技术栈选型

09 | 进一步考量和总结

10 | PMQ 2.0项目背景

11 | PMQ 2.0的设计解析（上）

12 | PMQ 2.0的设计解析（中）

13 | PMQ 2.0的设计解析（下）

14 | PMQ 3.0的演进

15 | Kafka的动态重平衡是如何工作的？（上）

16 | Kafka的动态重平衡是如何工作的？（下）

17 | 消息队列设计和治理最佳实践

18 | 第四章目录和大纲

19 | 微服务的四大技术难题是什么？

20 | 如何解决微服务的数据一致性分发问题？

21 | 如何解决微服务的数据聚合Join问题？

22 | 如何解决微服务的分布式事务问题？（上）

23 | 如何解决微服务的分布式事务问题？（下）

24 | 阿里分布式事务中间件Seata解析

25 | Uber微服务编排引擎Cadence解析

26 | 如何理解Uber Cadence的架构设计？

27 | 如何实现遗留系统的解耦拆分？

28 | 拍拍贷系统拆分项目案例

29 | CQRS/CDC技术在Netflix的实践

30 | 第四章总结

31 | SessionServer项目背景

32 | 总体架构设计

33 | 如何设计一个高性能基于内存的LRU Cache？

34 | 如何设计一个高性能大容量持久化的ConcurrentHashmap？

35 | 设计评估和总结

36 | SaaS项目healthchecks.io的背景和架构（上）

37 | SaaS项目healthchecks.io的背景和架构（下）

38 | 如何设计一个轻量级的基于DB的延迟任务队列？

39 | 如何设计一把轻量级的锁？

40 | 如何设计一个分布式限流系统？

41 | 如何设计一个分布式TopK系统实现实时防爬虫？

42 | 第七章目标和大纲

43 | 为什么说ServiceMesh是微服务的未来(上)

44 | 为什么说ServiceMesh是微服务的未来(下)

45 | 解析Envoy Proxy(上)

46 | 解析Envoy Proxy(下)

47 | Envoy在Lyft的实践

48 | 解析Istio

49 | K8s Ingress、Istio Gateway和API Gateway该如何选择？(上)

50 | K8s Ingress、Istio Gateway和API Gateway该如何选择？(下)

51 | Spring Cloud、K8s和Istio该如何集成？

52 | 第八章目标和大纲

53 | 拍拍贷案例：大型网站架构是如何演进的？

54 | 最小可用架构：Minimum Viable Architecture（上）

55 | 最小可用架构：Minimum Viable Architecture（下）

56 | 如何构建基于OAuth2/JWT的微服务架构？（上）

57 | 如何构建基于OAuth2/JWT的微服务架构？（下）

58 | 拍拍贷案例：如何实现数据中心机房的迁移？

59 | 携程/Netflix案例：如何实现同城双活和异地多活？

60 | 第九章大纲

61 | 学习开源项目的6个层次和8种方法（上）

62 | 学习开源项目的6个层次和8种方法（中）

63 | 学习开源项目的6个层次和8种方法（下）

64 | 百万年薪架构师是如何炼成的？

65 | 解读一份大厂的研发岗职级体系

66 | 结课测试&结束语



本节摘要

课件和 Demo 地址
https://gitee.com/geektime-geekbang/geektime-distributed

登录后留言

全部留言(5)

最新
精选

永昌

关于ping请求的入库，是异步延时，那么如果ping频率高的请求，在check的时候，可能还没入库，不就触发了警告了么？

作者回复: 有两个措施防止你说的问题： 1. healthchecks.io对ping的频率有限制，我记得最小粒度是1分钟间隔。 2. check可以设置grace period，也就是允许ping迟到的时间范围。

2020-09-10



1

Geek2808

能否解释一下开放健康检查接口和 ping 检查中心两种方式的优缺点

作者回复: ping一般只能检测简单的存活，开发定制的健康检查端点可以获取更细粒度的健康信息，如SpringBoot支持用户开发定制的健康检查逻辑，可以定制磁盘利用率，数据库连接，缓存连接等更细粒度的健康检查信息。

2021-07-05





邸昆

SaaS的核心点在于多租户，从架构介绍上看没有看到租户隔离的相关设计，从商业的视角付费用户和免费用户使用肯定要隔离开，否则付费的爸爸们不开心。从现在架构介绍上看，基于消息队列可以基于partition打散，减缓一些互相影响的情况，但是不可能无限多partition，还是无法完全避免相互影响。请问老师，针对租户间隔离，租户间影响这块，您有什么好的建议么？

作者回复: SaaS公司开始起步，一般都是一套DB逻辑隔离，简单成本低。到了一定的规模，有钱有人了，可以考虑私有部署物理隔离，这时候成本复杂性也上去了。通常做法是对用户分层，免费和低端用户使用共享的逻辑隔离，中高端付费用户进行私有部署物理隔离。

2020-12-22





姑射仙人

老师，我认为healthchecks不是一个SaaS应用，更像是一个传统的多用户服务端系统。如何理解、定义一个SaaS系统呢？

作者回复: SaaS = Software as a Service，把传统的软件产品，做成多租户通用版，部署在云端提供共享服务的形式，就可以称为SaaS。 healthchecks.io是一个轻量级的SaaS服务，它把对周期性任务(scheduled job)的健康检查，做成了一种云服务，大家可以共用，不需要每个企业再去部署一套。 healthchecks.io属于监控类SaaS产品。同样，sentry.io也是监控类SaaS产品，它把异常日志监控做成了一种云服务。还有auth0.com把企业身份认证做成了云服务，launchdarkly.com把功能开关做成了一种云服务，等等。

2020-09-26





老师，数据库是不是会成为瓶颈？

作者回复: 如果checks数量非常多，DB会成为瓶颈，这个时候有两个办法： 1. 采用类似killbill common queue的sticky polling技术，每个机器只处理本机写入的checks，这样相当于把 checks做了逻辑分组和负载分摊。 2. 对DB进行分片sharding，然后不同的告警检查任务(alert checker)分别处理不同的DB shard，分摊负载。

2020-08-11





收起评论