深入浅出可观测性
翁一磊
观测云产品技术总监
4965 人已学习
新⼈⾸单¥29
登录后,你可以任选4讲全文学习
课程目录
已完结/共 18 讲
深入浅出可观测性
15
15
1.0x
00:00/00:00
登录|注册

05 | 构建可观测平台:应该购买商业产品还是自己搭建?

你好,我是翁一磊。
上节课,我们介绍了现在非常热门的可观测性标准和规范 OpenTelemetry,你可以通过 OpenTelemetry 来构建针对你的系统和应用的可观测性。然而除了 OpenTelemetry,也有很多其他的开源工具、各种商业软件和产品。所以,在你撸起袖子准备开始干活之前,我们需要先讨论一下下面这个问题:建立可观测性,是应该自己搭建,还是直接购买商业产品呢?
首先我得承认,我自己就是一个可观测性软件供应商的职员。这样一来,你可能会觉得我一定会推荐购买商业产品。不过,公正性这点你可以放心,不管是哪一种方式,我都会从成本和收益的角度来给你介绍。最后的选择权,毕竟还是在你手上的。

成本和收益的考量

当我们考虑自建还是采购可观测平台的时候,你的第一反应可能是觉得自建更划算,因为开源软件都是免费的,而商业软件要满足企业的需求,基本上都是付费的,而且是一笔不小的投资。这是一个很明显的误区。实际上,我们应该考虑的是整体的拥有总成本(Total Cost of Ownership),也就是 TCO。
TCO 可以定义为一个实体(比如说一个企业)在适当条件下和时间范围内,使用和维护商品或服务所发生的所有费用。这个费用不仅仅是购买商品或服务的费用,还包括了下面很多方面。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

构建可观测平台:购买商业产品还是自己搭建?本文探讨了构建可观测性的成本和收益,比较了自建和购买商业产品两种方式。首先介绍了总体拥有成本(TCO)的概念,强调了在考虑成本时需要考虑资源成本、人力成本和拆除或最终处置成本。在收益方面,建立可观测性可以提升系统可靠性,为用户带来更好的体验和服务,同时缩短故障平均恢复时间(MTTR)。文章分析了自建和购买商业产品的成本和收益,包括资源成本、人力成本和隐性成本。购买商业产品的考虑因素包括产品价值、供应商支持、持续满足需求等。购买的收益方面,使用SaaS软件可以减少自建平台的资源投资和维护费用,同时获得专业的服务和解决问题的支持。总结指出,自建和购买并非非黑即白的问题,隐性成本往往被忽略,而可观测性团队对于满足企业业务的可观测性需求是必不可少的。下节课将介绍可观测对于DevOps、系统可靠性(SRE)的帮助,以及团队如何展开合作。思考题留给读者选择构建可观测平台的方式,并欢迎交流讨论。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《深入浅出可观测性》
新⼈⾸单¥29
立即购买
登录 后留言

全部留言(4)

  • 最新
  • 精选
  • includestdio.h
    从专栏开始到现在读下来有种感觉,就是可以感知到可观测性整体能实现什么功能,有什么好处,但是却不知道实际使用场景和排障过程中,应用起来是什么样子,总感觉有点抽象。我理解可观测性做的事情主要是把原始分散的链路 日志 指标监控根据业务关联串联了起来,减少人为分析串联的成本,但是我不太理解是怎么实现的串联,串联起来是什么样子,以及怎么应用,不知道后续老师会不会有此类实际场景中的介绍

    作者回复: 很好的反馈。后续是会有实际场景的介绍。前面的这几讲主要是为了梳理一些基础知识,后续会介绍团队的合作、SLO 的建立和跟踪,然后有 4 节的实战课程,通过实际的例子来具体介绍应用的场景和如何分析问题。是这么一个整体的讲解思路。

    2022-09-23归属地:上海
    5
  • 花花大脸猫
    基本还是自建加二开了,目前正在探索这部分,原先公司的pinpoint跟业务日志(log4j2吐给elk)还有指标数据(云商grafana)分散在三处,对于业务人员处理问题太不友好

    作者回复: 没错,这是比较常碰到的多个工具拼接的问题,这时候还是需要一个统一的平台

    2022-10-31归属地:上海
  • Demon.Lee
    老师,你好。目前我在用 Prometheus 收集各类度量指标(自建监控系统),但 Prometheus 本身不存储长期的数据,如果我想存储半年或一年的度量指标,就需要用到远程存储,官方提供了很多选项(https://prometheus.io/docs/operating/integrations/#remote-endpoints-and-storage),但我们作为小厂,不可能有精力挨个去测试验证一遍。如果按照时序数据库排名(https://db-engines.com/en/ranking/time+series+dbms),我们可能优先考虑 influxdb,但这一款不支持集群方案(除非购买商业版),所以放弃。老师是否有这方面的经验和建议,比如使用 Elasticsearch 存,或者选用 Thanos 架构等等,谢谢。

    作者回复: 可以看下VictoriaMetrics,最近比较热门,支持高可用,性能方面也不错

    2022-10-14归属地:上海
    8
  • Sudouble
    设计的系统没法自动随着需求的变化而升级,一直不报错的运行是才是最大的异常。 做好系统考虑的方面是真不少,需要在各个方面做取舍和权衡。
    2023-01-28归属地:北京
收起评论
显示
设置
留言
4
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部