大数据经典论文解读
徐文浩
bothub 创始人
13844 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 59 讲
大数据经典论文解读
15
15
1.0x
00:00/00:00
登录|注册

复习课(九)| Megastore

你好,我是黄金。今天我们来接着来复习下 Megastore 的论文。

Megastore 介绍

Megastore 是为了满足现代交互式在线服务的需求,而开发的存储系统。当今的交互式在线服务需要五种能力:
第一是高度可伸缩。随着在线服务的流行,用户的规模可能会增长到数百万,而用户规模的变化,就对服务的可伸缩性提出了要求。
第二是可快速开发。在线服务为了吸引用户,需要不断推出新功能,而新功能对数据存储模式的灵活性也提出了要求。
第三是低延迟。在线服务需要快速响应用户的请求。
第四是数据的一致性视图。数据修改之后,需要立即被用户看到,并且持久化存储起来。
第五是高可用。用户希望随时随地地访问在线服务,在线服务需要有足够的容错能力,在硬件故障、网络故障,甚至整个数据中心故障面前,依然能够提供服务。
而 Megastore,就正好混合了 NoSQL 数据库的灵活性和传统 RDBMS 的便利性。它既拥有 NoSQL 数据库那样的伸缩性、可用性和灵活的数据模式,又拥有 RDBMS 那样的 SQL API 和事务的特性。
徐老师用三节课,给我们讲解了 Megastore,分别对应了论文的第二部分、第三部分和第四部分。第一讲的主题是可用性和伸缩性,包括数据如何复制,如何分区,以及在物理上如何存储。第二讲的主题是 Megastore 的主要特征,包括数据模型、事务和并发控制。第三讲的主题是跨数据中心同步复制的实现,包括如何实现快速读和快速写、Megastore 整体架构、读写操作流程、协同服务器的作用和故障恢复。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

Megastore是一个为满足现代交互式在线服务需求而开发的存储系统,具备高度可伸缩、快速开发、低延迟、数据一致性视图和高可用等五种能力。它融合了NoSQL数据库的灵活性和传统RDBMS的便利性,同时支持跨数据中心同步复制。通过Paxos算法实现跨数据中心的可用性,并通过实体组的方式保证操作顺序执行和并发执行。其数据模型成功应用于Google,并被其继任者Spanner采用。Megastore的数据模型通过实体的Key将不同类型的实体数据预Join在一起,利用数据的局部性提高缓存效率,降低延迟。此外,Megastore支持可串行化的ACID语义,采用MVCC机制实现事务保障,读写操作采用乐观并发机制,产生冲突后重试操作。虽然Megastore的写操作性能较低,但它成功展示了分布式事务数据库的强大特性。在下一篇论文Spanner中,我们将看到Megastore的性能问题是如何被一一解决的。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《大数据经典论文解读》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部