亚马逊迁离Oracle之后:Prime Day当天瘫痪
极客时间编辑部
讲述:杜力大小:960.07K时长:02:03
近年来,亚马逊和 Oracle 一直在打口水仗,声称自家数据库软件和云工具的性能更胜一筹。现在,亚马逊终于领教了迁离 Oracle 数据库软件有多困难。
近日,根据 CNBC 获得的一份内部报告显示,在 Prime Day 促销日,这个头号电子零售商一边忙着处理导致销售流程减慢的重大网站故障,一边忙着应对其在俄亥俄州最大的一个仓库遇到的技术问题,该技术问题导致成千上万件包裹发货延迟。
文件显示,这个问题很有可能是由于亚马逊从 Oracle 数据库迁移到自家的数据库技术。亚马逊希望在 2020 年之前,完全摆脱 Oracle 数据库,而这次故障突显了这个过程中可能面临的挑战。
这个事情发生后,亚马逊的工程师撰写了一份长达 25 页的报告以纠正错误,试图了解这次重大事故发生的原因,以及如何防止将来重蹈覆辙。
报告显示,Prime Day 问题的根本原因是数据库迁移之后丢失了一项功能。文件显示,当 Aurora PostgreSQL 数据库出现错误时,亚马逊没有给出应急方案。报告称,没有能够用于 PostgreSQL 中分析的 SQL 语句数据,而要是有该数据,“原本有助于查明”问题的根本原因。
他们表示,Oracle 和 Aurora PostgreSQL 是两种不同的数据库技术,处理“保存点”(savepoint)的方式不一样。保存点是一种重要的数据库工具,用于跟踪和恢复单个事务。
在 Prime Day 当天,创建了数量过多的保存点,亚马逊的 Aurora 软件不堪重负,因而拖累了数据库的整体性能。
在 CNBC 透露了文件的细节后,伊利诺伊大学分校的计算机科学教授马特·西泽(Matt Caesar)表示,如果亚马逊坚持使用 Oracle 数据库,很可能不会发生这次故障。并且,如果亚马逊使用了 Oracle 的数据库,还有可能更早地诊断问题,从而有望缩短故障的持续时间。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- kyle在 CNBC 透露了文件的细节后,伊利诺伊大学分校的计算机科学教授马特·西泽(Matt Caesar)表示,如果亚马逊坚持使用 Oracle 数据库,很可能不会发生这次故障。 -- 只能说迁移出了问题,不能说非oracle不可。不折腾就不会出事,但还是得折腾。13
收起评论