34 | Borg（一）：当电力成为成本瓶颈

徐文浩

你好，我是徐文浩。
从 GFS 这样的分布式文件系统，到 MapReduce 这样的数据批处理系统；从 Bigtable 这样的分布式 KV 数据库，到 Spanner 这样全球部署的强一致性关系数据库；从 Storm 这样只能做到“至少一次”的流式系统，到 Dataflow 这样真正做到“流批一体”的统一数据处理系统。在过去的 30 多讲里，我和你一起看过了各式各样的大数据系统。
在研究这些大数据系统的时候，我们其实有一个假设。这个假设，就是其中的每一个系统，都需要占用一组独立的服务器。而在一个完整的大数据体系中，我们既需要有 GFS 这样的文件系统，也需要 MapReduce/Spark 这样的批处理系统，还需要 Bigtable 这样的 KV 数据库、Hive 这样的数据仓库、Kafka 这样的消息队列，以及 Flink 这样的流式系统。这样一算，我们需要的服务器可真不算少。
成本 - 混合编排的需求起源但是，当我们采购了很多服务器，搭建起了一系列的大数据系统，我们又会发现这些服务器在很多时候负载不高，显得非常浪费。因为我们在采购服务器的时候，需要根据平时的峰值流量来确定服务器数量。比如，像 Kafka 这样的消息队列，肯定是在早晚高峰，和中午用户比较多的时候，流量比较大，到了半夜流量就比较小。如果我们高峰时间的 CPU 占用要有 60%，那么在低谷时刻，可能只有 10%。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

Borg系统：解决大数据系统资源利用率低的利器 Borg系统是为解决大数据系统中服务器资源利用率低的难题而设计的解决方案。该系统通过混合编排和CGroups技术，有效解决了大数据系统在高峰时段浪费大量服务器资源的问题，从而降低了电力成本。文章介绍了Borg系统的基础概念、系统架构和解决方案，并探讨了其诞生背景和演化过程，以及Kubernetes作为其开源版本的发展。此外，文章还介绍了Linux下的CGroups功能，通过限制一组Linux进程使用的资源，实现了不同系统程序的隔离运行。Borg系统的系统架构是一个典型的Master-Slave系统，通过Paxos实现Master的高可用性和一致性，通过Borglet来管理每个服务器上的Tasks。任务调度按照优先级分成了监控任务、生产任务、批处理任务和尽最大努力完成的任务，同时添加了预留资源的alloc机制，确保任务能够按时完成。Borg系统的管理调度集群里的资源以及评估混合部署对系统性能的影响，为读者提供了对Borg系统的初步认识和了解。文章还提到了Borg的一个中等规模的Cell将会有1万台服务器，这也带来了集群管理系统面临的额外挑战。 Borg系统的出现为大数据系统的资源利用率提供了新的思路和解决方案，对于大数据系统的优化具有重要的参考价值。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《大数据经典论文解读》，新⼈⾸单¥59

立即购买

登录后留言

全部留言(4)

最新
精选

张耒
为啥说是电力成本呢文章是在讨论资源合理利用，避免闲置的情况这种应该耗电量更大吧？辛苦老师解答
2023-06-09归属地：北京

1
hadoop_admin
服务器多的话，监控、心跳都是问题
2022-02-21


csyangchsh
1 万台服务器的额外挑战能想到的有两个：网络和机器故障。
2022-01-10
1

那时刻
请问老师，CGroup进行资源的限制和权限的隔离，而namespace也有权限的隔离，它们的区别是什么呢？
2022-01-07
3


收起评论