分布式金融架构课
任杰
eBay 支付账务系统负责人,前蚂蚁金服架构师
19876 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 30 讲
开篇词 (1讲)
分布式金融架构课
15
15
1.0x
00:00/00:00
登录|注册

20 | 容灾(上)如何实现正确的跨机房实时容灾?

你好,我是任杰。这一讲我和你聊一聊如何实现正确的跨机房实时容灾。
这一讲我们主要从这三个方面的内容给你讲解容灾问题,它们分别是正确容灾、跨机房容灾和实时容灾。
因为“跨机房”和“实时”是两个标准的技术问题,所以有非常明确的方式方法和衡量标准,我们会在后面详细讲解。
相反,“正确”这两个字可能会因人而异,不同环境下可能会有不同的理解。因此我们在讲解技术问题之前,先看看怎么理解“正确”这两个字。

正确的定义

金融行业覆盖的面非常广,不同子行业对容灾的要求会不一样。一种分类方式是按照用户专业性来分类,这种分法会将用户分为一般性用户和专业用户两大类。
一般性用户指的是非从事专业金融类工作的用户。专业用户指的是以金融类工作谋生的用户。注意这里的用户并不限定为个人用户,其中还包括企业等机构用户。通俗来讲一般性用户指的是 C 端用户,专业用户是 B 端用户。
对于一般用户来说,日常使用最多的金融服务是手机支付。如果手机支付系统出现了问题,支付公司进行了容灾处理之后,我们能接受的“正确”的容灾结果一般有两个。
第一个是尽量在规定时间内恢复服务,比如在 10 秒内恢复。第二个是如果有限时间内不能恢复服务,那么要避免出现金额对不上的问题。比如说,我这边已经显示扣款了,商家那边却迟迟收不到钱的情况,就一定要避免。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文从金融行业的角度出发,探讨了正确容灾、跨机房容灾和实时容灾的概念和要求。首先,对“正确”的定义进行了阐述,强调了服务质量协议和事务正确性的重要性,以及在成本和风险之间的权衡。其次,文章提到了在发现问题方面的挑战,包括人工监控和系统监控的应用情况。在容灾过程中,针对服务容灾和数据容灾分别进行了讨论,包括无状态服务容灾、消息重发问题、有状态服务容灾以及数据容灾的两种常见方案。文章以金融行业为背景,深入浅出地介绍了跨机房实时容灾的技术特点和挑战,对于从事金融科技或相关领域的读者具有一定的参考价值。文章内容涉及了单节点容灾、多节点跨机房容灾以及客户端处理等方面,强调了正确性和服务质量协议的重要性,同时提出了不同部署方式的优缺点,为读者提供了全面的容灾技术知识。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《分布式金融架构课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(3)

  • 最新
  • 精选
  • tt
    三地九中心相比三地五中心的优势应该是可以容忍两个地方的数据中心同时故障。此时剩下的一个城市,仍然是一个raft集群,可以容忍数据中心级的故障。
    2021-02-08
    4
  • webmin
    1. 每一组中的某个节点发生故障只要不是对外提供服务的主主节点,就不会发生重新选主主节点,导致有可能让所有客户改变主主节点的问题; 2. 宕掉的是主主节点,选主主节点是在另换两个组中的主节点之间进行,这样选出主主节点会快一些,共识工作按范围做,这个和金字塔形的分层管理结构是一样;
    2021-02-08
    3
  • 宋丹
    说的不对,三个节点如果不能实现两个数据中心的灾备,那要灾备干嘛?灾备本来就是要求主机房挂了,灾备机房要能够接管主机房
    2021-05-22
收起评论
显示
设置
留言
3
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部