16|性能上如何优化数据查询?
彭旭
你好,我是彭旭。
上一讲我们在 StarRocks 里选择了适合 CDP 的存储模型。这一讲我们来看看 CDP 的几个场景,在 StarRocks 下,能否优化、如何优化。
CDP 在 StarRocks 下的性能测试
为了让你对 StarRocks 性能有一个更直观的感受,我们先来准备一下测试数据。
数据准备
上一讲,我们为 CDP 的几个表准备好了 DDL 语句,还剩下一个标签表没有定义。
但在讲数据如何分区的时候,我们推测的结论是可以用“标签值 + 用户唯一 ID”作为分桶。所以,标签表最终具体建表 DDL 就像这样。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
1. StarRocks提供了基于Cascades框架的CBO(Cost-based Optimizer),通过CBO分析各种数据信息,来评估成本,帮助选出最经济的查询计划,提高复杂查询的速度和效果。 2. StarRocks会自动构建基于排序列的稀疏索引,并可以显式地创建位图索引和布隆过滤器索引,这些索引结构可以减少索引的大小,提高查询效率。 3. StarRocks的高性能原因还包括选择最优的查询计划、减少需要扫描的数据、选择合适的Join方式等。 4. 通过SQL可以生成CDP用户标签,进行人群圈选,满足中等规模CDP的性能需求。 5. StarRocks的性能测试结果表明,执行复杂查询的SQL基本都在秒到分钟级内执行完成,表现出较好的性能。 6. StarRocks的索引优势和高性能使其成为适合CDP场景的存储引擎,能够满足复杂查询和大规模数据处理的需求。 7. 通过StarRocks提供的高性能,可以实现给特定用户群体推送个性化营销活动的需求,提升营销效果和用户体验。 8. StarRocks的性能优势主要体现在基于代价的优化器CBO、索引结构的优化以及高效的查询执行计划。 9. StarRocks提供了Query Cache机制,可以提升对并发的支持,通过缓存查询过程中的本地聚合中间结果来复用,从而加速查询。 10. StarRocks采用MPP分布式执行框架,通过将任务分散到多个节点上并行执行,充分利用所有执行节点的资源,提高数据处理速度和性能。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《分布式数据库从入门到实战》,新⼈⾸单¥59
《分布式数据库从入门到实战》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论