美团点评离线存储团队技术专家,2013 年毕业于哈尔滨工程大学,2015 年加入美团,负责美团点评 HDFS、HBase 服务,先后深度参与了 HDFS Federation 兼容性改造和落地,美团点评数据平台融合,常态、异地、单集群、多机房 Hadoop 架构改造,HDFS NameNode 锁粒度拆分,增量数据生产架构演进等重点项目。在 HDFS、HBase 方面有大量的源码和架构实践经验,致力于为美团点评提供稳定、高效、易用的大数据存储服务。
随着美团点评以吃为核心的多场景业务的飞速发展, 美团点评的 Hadoop 集群规模持续每年翻番, 2017 年 Hadoop 集群规模突破万台, 超出单机房容量上限, 势必要提供多机房的 Hadoop 服务。
现有 Hadoop 架构没有机房概念,在多机房部署 Hadoop 服务时,会导致大量的跨机房流量和请求严重降低集群吞吐。业内在解决 Hadoop 多机房部署问题时,往往采用一个机房一套集群的运维方式,但这会使机房概念最大程度的暴露到数据生产层面,提高了数据开发成本。
在此背景下, 美团点评离线团队秉持以业务为中心的价值导向, 通过技术换运营,自主研发了对业务提供透明的、数据强一致性保障的、常态、异地域、多机房、单集群 Hadoop 服务。
目前, 美团点评 Hadoop 集群规模数万台, 是业界唯一一家提供常态、异地域、多机房、单集群 Hadoop 服务的科技企业。此次分享整个方案设计和落地,给业界同行在面临同样场景时以参考。