合辑:大规模基础设施DevOps探索
面对百万台服务器、千万张网卡、海量的配置项和监控点,怎么第一时间知道故障点在哪里?如何快速判断分析当前故障的影响面和修复途径?怎样在不影响业务的情况下快速修复?也许你早就抛弃了SSH和CLI的方式去运维一套庞大的基础设施,开始尝试写一些自动化脚本和配置。或者已经搭建了一套自动化的监控平台,并在这条前行的路上不断的踩坑成长。面对这样一个充满挑战和机遇的方向,你不是一个人在战斗。这个专题为你召集了一批志同道合的同学,基于实际的项目和开发,分享在大规模基础设施DevOps领域的新思路,新架构,新技术。让我们共同探索它未来的方向,向着更自动,高效,智能的运维新高度攀登。 展开