深入浅出云计算
何恺铎
复星集团首席架构师
24360 人已学习
新⼈⾸单¥29
登录后,你可以任选4讲全文学习
课程目录
已完结/共 19 讲
结束语 (1讲)
深入浅出云计算
15
15
1.0x
00:00/00:00
登录|注册

07 | 云端架构最佳实践:与故障同舞,与伸缩共生

多云架构
多区域架构层面的预案
虚拟私有网络跨越可用区
多可用区的实例部署
物理分散部署
创建多台虚拟机组成的集群
弹性伸缩
虚拟机规模集
EC2自动伸缩
区域级别的事故
数据中心级别的故障
宿主机级别的故障
Design For Failure原则
弹性伸缩服务和成本优势虚拟机的融合
会话保持的作用和原理
云端弹性架构实现
负载均衡器
虚拟机编组
弹性伸缩的优势
云端架构的另一个原则
不同层面的故障
架构思维的角度
云服务的可靠性和SLA
故障的不可避免性
思考题
伸缩活动历史记录
伸缩组的峰值状态
创建弹性伸缩实例
建立对外的负载均衡实例
搭建简单的Web服务
随机应变,弹性伸缩
面对故障,提升冗余
课堂总结与思考
高可用的弹性架构实战
云端架构的注意事项和最佳实践
云端架构注意事项和最佳实践

该思维导图由 AI 生成,仅供参考

你好,我是何恺铎。这一讲,我们来谈谈云上架构的注意事项和最佳实践。
云上架构最需要注意什么呢?就像我在标题所描述的那样,云端架构一方面需要处理和应对可能出现的故障,保证架构和服务的可用性;另一方面则是需要充分利用好云端的弹性,要能够根据负载进行灵活的伸缩。

面对故障,提升冗余

故障,是 IT 业界的永恒话题。故障的原因多种多样,无论是由于硬件的自然寿命造成的,还是数据中心的极端天气捣鬼,或是人工运维操作上的失误,不论我们多么讨厌它,故障似乎总是不可避免。
你也许会问,那么,云计算会有故障吗?比如说,云上创建的虚拟机,是否百分之百会工作正常呢?
很遗憾,虽然公有云们为了避免故障,在许多层面上做了冗余和封装,但云也不是可以让你永远无忧无虑的伊甸园。我们需要牢记,云端的服务仍然是有可能出故障的,只是概率上的不同而已。这也是云供应商们为云服务引入服务等级协议(Service Level Agreement,简称 SLA)的原因,它主要是用来对服务的可靠性作出一个预期和保证。
SLA 的可用性等级可能是 99.9%,也可能是 99.99%,它能够表明某项云服务在一段时间内,正常工作的时间不低于这个比例,也代表了厂商对于某项服务的信心。不过你要知道,再好的服务,即便是 SLA 里有再多的 9,也不可能达到理论上的 100%。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

云端架构中的故障处理与弹性伸缩是关键的技术挑战,本文深入探讨了这一话题。作者强调了在面对故障时提升冗余的重要性,并提出了多可用区的实例部署和跨区域的实时同步等关键措施。此外,文章还强调了多云架构的重要性,以降低服务风险。在追求可用性时,需要在成本投入与可用性之间获得一个最佳的平衡。同时,文章还介绍了弹性伸缩的原则和实战案例,以及如何在阿里云上进行服务搭建和弹性扩展。通过实例展示了如何使用弹性伸缩服务来实现云端弹性架构,以及如何结合负载均衡器来实现高可用的弹性架构。总的来说,本文为读者提供了深入的见解和宝贵的实践建议,帮助他们快速了解云端架构的故障处理与弹性伸缩的最佳实践。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《深入浅出云计算》
新⼈⾸单¥29
立即购买
登录 后留言

全部留言(22)

  • 最新
  • 精选
  • 何恺铎
    置顶
    [上讲问题参考回答] 1. VPC内双机互联取决于机器的配置,云上单机内网带宽一般和自身性能正相关。许多云会给出具体数值,注意这里不要和公网带宽混淆。另外,两机物理距离也是实际效果的潜在影响因素,例如是否位于同一宿主机,是否位于同一可用区等等。 2. 反过来引导外界流量进入VPC,除了最简单的eIP绑定到虚拟机之外,主要考虑使用负载均衡和DNAT。
    2020-03-20
    9
  • 罗辑思维
    问题1 「负载均衡器」将同一客户端的会话请求转发给指定的一个后端服务器处理。 如何识别客户端:四层请求用源IP,七层请求用cookie。 如何赶走客户端:通过设置会话超时时间。 问题2 项目中以包年包月主机为主,资源不够时再触发生成按量计费虚拟机。

    作者回复: 赞

    2020-03-18
    11
  • 八哥
    如果代码要更新了,不知道镜像会不会自动更新,否则每次迭代发布,要重复执行自动伸缩的步骤。

    作者回复: 镜像不会自动更新的。所以更新代码后需要重新打包镜像并替换原有镜像,可以用脚本来完成这个操作。

    2020-03-18
    2
    8
  • 怀朔
    1、会话保持 为了同一个客户端多次连接是保证同一客户端多次连接路由到同一个服务上。 负载均衡关闭会话保持,长链接在keep-alive的状态下,也会路由到同一服务,连接断开重连的情况下会负载均衡分布。 原理:应该就是长链接吧...不是很懂。老师分析 2、计算问题 我觉得 有按量停机不收费。我觉得做的还是比较优秀的 按量和竞价本身的都可以容入弹性体系 核心的还是业务都是到底允不允许加入 目前阿里云 腾讯云 这一个只做到机器级别的弹 应用级别目前还没有到达 核心点 个人觉得主要点应用程序内容发布频率很高原因.

    作者回复: 和长连接没有关系哦,多次短连接也可以做到会话保持

    2020-03-18
    3
  • Sports
    建议老师可在每节课开始之前说下上节课思考题的思路哈

    作者回复: 谢谢你的建议。原本是打算后面统一整理回答的,接下来会陆续在每讲的评论区给出前一讲问题的参考回答。

    2020-03-18
    3
  • 像阿里云 SLB 服务,后面的后台虚拟机是不是只能是阿里云的虚拟机? 也就是一个平台提供的IaaS服务只能和本平台提供的其他服务做对接? 不能和其他平台相互对接? 有没有办法突破这个限制?

    作者回复: 一般来说,云上的SLB只支持自家的虚拟机。如果想和其他云平台融合架构,可以看看第三方厂商的多云解决方案。

    2020-03-18
    2
    2
  • 丁乐洪
    老师会讲一下迁移上云的注意点吗?

    作者回复: 第8讲中我们会提到迁移,你可以看一下。

    2020-03-22
    1
  • 小狼
    “负载均衡器本身也需要是高可用的“,这里需要建立两个同样的负载均衡器吗?

    作者回复: 不需要两个负载均衡。云上负载均衡的内部实现本身包含了高可用设计。这里我们还设置了备可用区,当主可用区故障时这个负载均衡实例仍能正常工作。

    2020-03-19
    2
    1
  • TKbook
    真心建议老师本节末尾解答一下上一节的思考题

    作者回复: 没问题。原本是打算后面统一整理回答的,接下来会陆续在每讲的评论区给出前一讲问题的参考回答。

    2020-03-18
  • 我来也
    之前在阿里云上购买实例时,在最后一个界面上,有个选项是"部署集". 之前一直没有配置过,没有研究. 听老师这么一说, 原来是做这个用途的,哈哈! 在购买k8s的工作节点时,我觉得可以把这个功能用起来. 平常的服务,还是没有太大的必要.毕竟本身还都是单节点的,一个坏了, 就整个都不可用了. 说起无状态的服务, 现在的云上,各种服务太全了, 只需要花钱就可以买现成的. 这样把有状态的数据Mysql Mongodb Redis, 把中间件Kafka, 把ES服务等都买现成的. 很容易可以把处理业务的模块改造成无状态的服务. 本身云服务就是高可用的,再自己把无状态的节点按老师说的,弄成多可用区,多机架.几乎也是高可用的了.
    2020-03-18
    2
收起评论
显示
设置
留言
22
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部