26 | 怎么规划和控制数据库的复制延迟大小?
该思维导图由 AI 生成,仅供参考
什么是数据库的复制延迟?
- 深入了解
- 翻译
- 解释
- 总结
数据库的复制延迟对互联网公司的业务影响巨大。本文通过LinkedIn的案例,详细介绍了如何规划和控制数据库的复制延迟。首先,文章解释了数据库的复制延迟是指一条信息从源头数据库传递复制到下游数据库时的延迟。然后,通过LinkedIn的用户流量特点和数据传输复制系统的介绍,阐述了如何通过容量规划和分析来控制数据的复制延迟。在容量规划和分析中,需要考虑用户流量、复制模块的吞吐量、复制的延迟以及复制延迟的SLA,以确保所需的复制延迟不超过SLA的规定。文章还详细介绍了采用ARIMA模型进行时间序列建模来预测未来数据流量,并通过季节指数来预测一周内每个小时的流量。此外,文章还介绍了使用二进制搜索机制来确定复制容量,并强调了预测误差对延迟SLA的影响。最后,通过LinkedIn的生产实践验证了规划和分析模型的有效性。整体而言,本文通过LinkedIn的案例,详细介绍了如何通过合理的规划和分析,使用ARIMA统计模型和季节指数来控制数据库复制延迟,为读者提供了一套完整的解决方案。
《性能工程高手课》,新⼈⾸单¥59
全部留言(5)
- 最新
- 精选
- hello老师,祝您新年快乐
作者回复: 谢谢!新年快乐!
2020-01-242 - Scott这个好像对我们很有用,我们预估是直接用上一周同一天的流量来预测,问题是有时候遇到特殊情况,比如春节国庆,就行不通了。
作者回复: 嗯,如果是面向终端客户的,特殊日期/事件必须单独考虑。
2020-01-271 - xiaobang1 对排队论不了解,这边把数据的传输复制系统看成是一个排队系统,排队论给我们提示了什么信息?有没有排队论和它的重要结论的通俗资料推荐呢 ? 2 不了解ARIMA和季节性指数,有什么学习资料推荐吗 ? 3 有了预测流量怎么计算延时的呢 ?
作者回复: 1.排队论方面,介绍的书籍挺多的,你可以搜一下。也不需要太复杂的资料,了解基本的就够了。 2. ARIMA和季节性指数在统计方面的书籍和资料里面。 3. 有了预测流量,就相当于有了客户输入的信息。放到一个队列系统里面,就可以计算出延时(包括排队时间和处理时间)了。
2020-02-132 - Joe Black请问LinkedIn是用的mysql数据库吗?对于单个数据中心,对于大量用户事件写入和读取怎么解决的?是通过数据库复制做主从集群吗?我觉得主库估计也得做分片吧?目前来看解决这个复制延迟主要就是通过部署更多节点的方式吗?
作者回复: LinkedIn之前用Espresso,基于Mysql的。离开3年了,应该有些变化。大量的用户流量只能通过水平扩展来适应(horizontal scaling);是的,分片。 数据库复制主要是为了分散读取,并且全球多数据中心同步。 解决复制延迟也是通过水平扩展,分散的节点越多,处理越快。
2020-01-31 - 黄海峰听不懂,应该具体一点,实践篇应该具体到用什么软件什么命令执行,现在实践篇也是理论。。。
作者回复: 这一讲的目的是“工程实践”一些规划的理论;用的例子是LinkedIn公司的例子(Espresso数据库, Databus复制)。这些软件都是Linkedin内部开发的;虽然都有开源,但是我觉得外面用的公司不多。 这个专栏的目的是给大家整体介绍这个职业,所以宏观的知识多些。 不过这一讲听不懂也不用灰心。我在专栏里介绍了很多种容量和性能方面的工作;但是,具体到一个公司,一个岗位,所作的具体工作多数时候其实很窄的;不需要都会的。 我建议多从宏观上把握,具体到某项工作时,再钻进去学。这样就不会迷失在具体的繁琐工作中。
2020-01-28