马晓宇,PingCAP 分析型产品负责人。曾就职于 Quantcast、网易,负责构建和管理大数据平台。关注分布式系统,SQL 引擎开发等领域。
实时分析平台的架构选型是一个需要多维度权衡的问题。NoSQL 提供了非常低的延迟,但分析能力往往孱弱;Hadoop + MPP 引擎或者分析型数据库提供了复杂的分析能力,但很难胜任实时要求高的场景。如果把他们当做光谱的两端,那其中还有各种不同方案尝试填补空缺,用户往往需要通过复杂的架构来补齐不同方案的短板。
TiDB 是一款开源分布式 NewSQL 数据库,它提供了良好的延展性和应对复杂场景的分析能力。对比 NoSQL,它拥有完整的数据库特性支持,降低开发成本;而相对数据湖和分析数据库,它又能很好地承载较高并发的分析场景;配合 TiFlash 以及 TiSpark,传统 Hadoop 平台上的复杂分析也能良好地解决。因此除了传统的 OLTP 场景之外,TiDB 也可以胜任诸多实时分析的场景,甚至在一些场合,它可以作为一个整合的数据平台大大简化系统架构。本次分享将和大家探讨 TiDB 关于实时分析场景的特性和设计以及适用场景,对比它与其他方案的优劣,以及进行中和计划中的相关改进。