GitHub使用Spokes进行跨数据中心复制
极客时间编辑部
讲述:杜力大小:936.63K时长:02:00
近日,来自 GitHub 的基础设施工程师迈克尔·哈格蒂(Micheal Haggerty)发表了一篇博文,解释他们是如何使用 Spokes 进行跨数据中心复制的,包括如何减少网络往返次数、引入三阶段提交、优化参考更新的性能以及其他各种调优。
哈格蒂解释说,GitHub 通过跨数据中心复制代码仓库来最大化弹性和降低延迟。一旦数据中心发生故障,就需要由另一个区域的副本接替工作,所以,为了得到最好的性能,GitHub 就需要为用户提供距离最近的副本。
Spokes 用于复制用户的代码仓库,确保代码仓库之间是同步的。它就像代理一样,在应用层面透明地执行复制任务。哈格蒂说,以前只有距离很近的代码仓库之间才能进行复制作业,后来通过降低延迟和优化参考更新性能等方式解决了这个问题。
之前在进行复制时延迟会不断增加,阻碍了 Spokes 进行参考更新的速度。虽然这对大多数用户来说并不是大问题,但有些 Git 工作流在这方面有很高的要求。哈格蒂表示,GitHub 托管着将近 7000 万个代码仓库,有些用户的工作流根本无法预测,因此他们也非常关注一些极端情况,努力让 GitHub 能够应付所有场景。
哈格蒂也解释了 GitHub 内部是如何处理参考更新的。GitHub 基于内部的测试来决定是否合并或 rebase 一个 PR。如果某个分支有多个 PR,那么每个 PR 都需要通过测试。
减少网络往返次数可以有效降低延迟。GitHub 使用三阶段提交协议来更新副本,同时使用分布式锁来保证更新次序。不过这样需要四个网络往返,成本有点高。他们也在努力确保在等待网络调用结束之前先完成其他的任务。
GitHub 的工程师也参与了 Git 项目,包括处理参考更新的事务机制,该机制基于副本是否有能力执行参考更新,来决定是提交还是回滚事务,还有其他一些与参考更新操作相关的改进。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- GeekAmIGuthub这个公司是通过git这个开源工具进行创业的绝佳案例2
收起评论