Redis 源码剖析与实战
蒋德钧
中科院计算所副研究员
17747 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 47 讲
Redis 源码剖析与实战
15
15
1.0x
00:00/00:00
登录|注册

18 | 如何生成和解读RDB文件?

你好,我是蒋德钧。
从今天这节课开始,我们又将进入一个新的模块,也就是可靠性保证模块。在这个模块中,我会先带你了解 Redis 数据持久化的实现,其中包括 Redis 内存快照 RDB 文件的生成方法,以及 AOF 日志的记录与重写。了解了这部分内容,可以让你掌握 RDB 文件的格式,学习到如何制作数据库镜像,并且你也会进一步掌握 AOF 日志重写对 Redis 性能的影响。
然后,我还会围绕 Redis 主从集群的复制过程、哨兵工作机制和故障切换这三个方面,来给你介绍它们的代码实现。因为我们知道,主从复制是分布式数据系统保证可靠性的一个重要机制,而 Redis 就给我们提供了非常经典的实现,所以通过学习这部分内容,你就可以掌握到在数据同步实现过程中的一些关键操作和注意事项,以免踩坑。
好,那么今天这节课,我们就先从 RDB 文件的生成开始学起。下面呢,我先带你来了解下 RDB 创建的入口函数,以及调用这些函数的地方。

RDB 创建的入口函数和触发时机

Redis 源码中用来创建 RDB 文件的函数有三个,它们都是在rdb.c文件中实现的,接下来我就带你具体了解下。
rdbSave 函数
这是 Redis server 在本地磁盘创建 RDB 文件的入口函数。它对应了 Redis 的 save 命令,会在 save 命令的实现函数 saveCommand(在 rdb.c 文件中)中被调用。而 rdbSave 函数最终会调用 rdbSaveRio 函数(在 rdb.c 文件中)来实际创建 RDB 文件。rdbSaveRio 函数的执行逻辑就体现了 RDB 文件的格式和生成过程,我稍后向你介绍。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文深入介绍了Redis数据持久化的实现细节,重点讲解了RDB文件的生成方法和文件结构。文章首先介绍了RDB文件的生成入口函数和触发时机,包括rdbSave、rdbSaveBackground和rdbSaveToSlavesSockets函数。通过实际操作演示了如何生成RDB文件,并介绍了如何使用od命令查看RDB文件的内容。此外,文章还介绍了RDB文件头的生成过程,包括魔数的生成和属性信息的记录。通过技术细节的讲解,帮助读者深入了解了Redis数据持久化的实现和RDB文件的生成与解读过程。 在生成文件数据部分,文章详细介绍了rdbSaveRio函数的循环流程,遍历每个数据库,将其中的键值对写入RDB文件。同时,解释了RESIZEDB操作码的记录和键值对的写入过程,包括类型标识、key和value的记录。最后,介绍了RDB文件尾的生成,包括文件结束的操作码标识和RDB文件的校验值。 总结来说,本文通过深入解析Redis内存快照文件RDB的生成过程,帮助读者全面了解了RDB文件的结构和内容,以及生成方法。读者可以通过本文了解RDB文件的格式和生成方法,从而开发解析或加载RDB文件的程序,用于优化Redis性能、分析业务数据特点,或进行测试和故障排查。 文章内容丰富,深入浅出,对于想要深入了解Redis数据持久化实现细节的读者来说,是一篇极具价值的技术文章。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《Redis 源码剖析与实战》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(3)

  • 最新
  • 精选
  • 曾轼麟
    先回答老师的问题:serverCron函数中,查找到 rdbSaveBackground 函数一共会被调用执行几次? 答:包含直接或者间接,一共调用了4次(不知道还有没有漏的) 1、【直接调用】:server.c(1296行) 如果达到了更改量阈值,等待秒数阈值,延时失败重试达到时间,会进行一次调用。 2、【直接调用】:server.c(1369行) bgsave因为AOF重写的原有被迫推迟,所以在最后需要重新调用。 3、【间接调用】:replicationCron(1340行) -> startBgsaveForReplication -> rdbSaveBackground 主从复制定时任务,通过startBgsaveForReplication,触发的RDB文件保存。 4、【间接调用】:backgroundSaveDoneHandler(1261行) -> backgroundSaveDoneHandlerDisk/backgroundSaveDoneHandlerSocket -> updateSlavesWaitingBgsave -> startBgsaveForReplication -> rdbSaveBackground 如果当前的进程角度是rdb_child_pid子进程,在结束bgsave后可能有机器在等待RDB文件,那么会调用 updateSlavesWaitingBgsave,从而间接的可能调用startBgsaveForReplication函数 补充总结: 本期老师主要介绍了Redis的持久化做法和RDB文件的编码方式,包括文件头部的编码方式,文件的键值对写入的编码方式,还有写入的触发时机等等,也方便我们日后自行解析RDB文件。 此外在本次源码中多次出现了RIO的标识,这里解释一下,RIO其实是unix下的一款IO包,起本质是封装了操作系统I/O,能通过缓冲区的方式调用操作系统I/O去对文件进行读写,此外Redis在保存RDB文件也使用了一些技巧,例如在rdbSave函数中,文件是先写入tmpfile(临时文件)的,最后通过rename的方式修改文件名字来替换掉整个文件,这是安全的文件写入方式,如果在写入期间掉电也并不会导致旧RDB文件损坏,但是也证明在磁盘预留上是需要双倍空间的。
    2021-09-08
    19
  • Kaito
    1、RDB 文件是 Redis 的数据快照,以「二进制」格式存储,相比 AOF 文件更小,写盘和加载时间更短 2、RDB 在执行 SAVE / BGSAVE 命令、定时 BGSAVE、主从复制时产生 3、RDB 文件包含文件头、数据部分、文件尾 4、文件头主要包括 Redis 的魔数、RDB 版本、Redis 版本、RDB 创建时间、键值对占用的内存大小等信息 5、文件数据部分包括整个 Redis 数据库中存储的所有键值对信息 - 数据库信息:db 编号、db 中 key 的数量、过期 key 的数量、键值数据 - 键值数据:过期标识、时间戳(绝对时间)、键值对类型、key 长度、key、value 长度、value 6、文件尾保存了 RDB 的结束标记、文件校验值 7、RDB 存储的数据,为了压缩体积,还做了很多优化: - 变长编码存储键值对数据 - 用操作码标识不同的内容 - 可整数编码的内容使用整数类型紧凑编码 课后题:在 serverCron 函数中,rdbSaveBackground 函数一共会被调用执行几次?这又分别对应了什么场景? 在 serverCron 函数中 rdbSaveBackground 会被调用 2 次。 一次是满足配置的定时 RDB 条件后(save <seconds> <changes),触发子进程生成 RDB。 另一次是客户端执行了 BGSAVE 命令,Redis 会先设置 server.rdb_bgsave_scheduled = 1,之后 serverCron 函数判断这个变量为 1,也会触发子进程生成 RDB。
    2021-09-07
    1
    9
  • Geek_6580e3
    老师好,能咨询个问题,redis321版本是有unknown RDB format version:7 #3353的bug吗,使用中遇到这个问题,但不知道什么情况下会触发,谢谢
    2022-02-10
收起评论
显示
设置
留言
3
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部