下载APP
登录
关闭
讲堂
算法训练营
Python 进阶训练营
企业服务
极客商城
客户端下载
兑换中心
渠道合作
推荐作者
当前播放: 45 | Bucket & Metric聚合分析及嵌套聚合
00:00 / 00:00
标清
  • 标清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看

Elasticsearch核心技术与实战

共100讲 · 约1000分钟
16573
免费
01 | 课程介绍
免费
02 | 内容综述及学习建议
免费
03 | Elasticsearch简介及其发...
免费
04 | Elastic Stack家族成员及...
免费
05 | Elasticsearch的安装与...
06 | Kibana的安装与界面快速...
07 | 在Docker容器中运行Elas...
08 | Logstash安装与导入数据
09 | 基本概念:索引、文档和...
10 | 基本概念:节点、集群、分...
11 | 文档的基本CRUD与批量操...
12 | 倒排索引介绍
13 | 通过Analyzer进行分词
14 | Search API概览
15 | URI Search详解
16 | Request Body与Query ...
17 | Query String&Simple ...
18 | Dynamic Mapping和常见...
19 | 显式Mapping设置与常见参...
20 | 多字段特性及Mapping中配...
21 | Index Template和Dynami...
22 | Elasticsearch聚合分析简...
23 | 第一部分总结
24 | 基于词项和基于全文的搜索
25 | 结构化搜索
26 | 搜索的相关性算分
27 | Query&Filtering与多字...
28 | 单字符串多字段查询:Dis...
29 | 单字符串多字段查询:Mult...
30 | 多语言及中文分词与检索
31 | Space Jam,一次全文搜索...
32 | 使用Search Template和In...
33 | 综合排序:Function Scor...
34 | Term&Phrase Suggester
35 | 自动补全与基于上下文的提...
36 | 配置跨集群搜索
37 | 集群分布式模型及选主与脑...
38 | 分片与集群的故障转移
39 | 文档分布式存储
40 | 分片及其生命周期
41 | 剖析分布式查询及相关性算...
42 | 排序及Doc Values&Field...
43 | 分页与遍历:From, Siz...
44 | 处理并发读写操作
45 | Bucket & Metric聚合分...
46 | Pipeline聚合分析
47 | 作用范围与排序
48 | 聚合分析的原理及精准度问...
49 | 对象及Nested对象
50 | 文档的父子关系
51 | Update By Query &...
52 | Ingest Pipeline & Pa...
53 | Elasticsearch数据建模实...
54 | Elasticsearch数据建模最...
55 | 第二部分总结回顾
56 | 集群身份认证与用户鉴权
57 | 集群内部安全通信
58 | 集群与外部间的安全通信
59 | 常见的集群部署方式
60 | Hot & Warm架构与Shard...
61 | 分片设计及管理
62 | 如何对集群进行容量规划
63 | 在私有云上管理Elasticsea...
64 | 在公有云上管理与部署Elas...
65 | 生产环境常用配置与上线清...
66 | 监控Elasticsearch集群
67 | 诊断集群的潜在问题
68 | 解决集群Yellow与Red的问...
69 | 提升集群写性能
70 | 提升进群读性能
71 | 集群压力测试
72 | 段合并优化及注意事项
73 | 缓存及使用Breaker限制内...
74 | 一些运维的相关建议
75 | 使用Shrink与Rollover AP...
76 | 索引全生命周期管理及工具...
77 | Logstash入门及架构介绍
78 | 利用JDBC插件导入数据到El...
79 | Beats介绍
80 | 使用Index Pattern配置数...
81 | 使用Kibana Discover探索...
82 | 基本可视化组件介绍
83 | 构建Dashboard
84 | 用Monitoring和Alerting监...
85 | 用APM进行程序性能监控
86 | 用机器学习实现时序数据的...
87 | 用机器学习实现时序数据的...
88 | 用ELK进行日志管理
89 | 用Canvas做数据演示
90 | 项目需求分析及架构设计
91 | 将电影数据导入Elasticsea...
92 | 搭建你的电影搜索服务
93 | 需求分析及架构设计
94 | 数据Extract & Enrichm...
95 | 构建Insights Dashboard
96 | Elastic认证介绍
97 | 考点梳理
98 | 集群数据备份
99 | 基于Java和Elasticseach构...
100 | 结束语

精选留言(12)

  • 2019-10-29
    老师,能简单介绍一下预聚合优化吗?
    1
  • 2019-10-01
    请问老师,官方文档究竟有没有一个dsl对象的一个清晰的结构图的呢?比如query、aggs、bool这些对象里面有哪些具体属性。我目前光靠文档中的demo只能依样画葫芦,却对那些对象没有一个系统的认识,后来用kibana的自动补全功能会稍微有点帮忙,但还是没有系统的认识。请老师指点一下

    作者回复: 分类不是一件简单的事,你可以从不同的维度进行分类。es官方文档其实也从不同维度举行了分类。
    例如 term query v.s match query,你需要搞清楚他们之间的区别,以及分词器的一些概念。 bool query 相对一般的query 增加了filter 和query context。至于aggs,其实是一种特殊的query。我建议你先一股脑的都做一个大概了解。然后结合每一个课程中的实例尝试着理解使用场景。然后再尝试着去做分类。心急吃不了热豆腐,相同的case,很多时候可以用不同的dsl实现的

    1
  • 2019-08-18
    terms aggregation 那页的ppt,keyword默认支持的不是doc_values么,为什么是fielddata,keyword设置mapping的时候,并不能把fielddata设为true

    作者回复: 哪一页ppt?keyword是doc values,如果需要对text进行聚合,需要将text字段的fielddata设置成true

    1
    1
  • 字段需要打开 fielddata,才能进行 terms aggregation ?这段不怎么懂。
    官方文档 https://www.elastic.co/guide/en/elasticsearch/reference/current/fielddata.html
    fielddata 现在只是针对 text 需要聚合可通过启用 fielddata 来让 text 支持聚合,fielddata 太过昂贵,通常也得不到想要的结果,官方并不建议这样做。比较建议的是使用 fields 通常可以得到想要的结果,keyword 是 doc_values ,跟 fielddata 好像没关系。
    展开
  • 2019-11-20
    老师,想问一下sql转dsl的时候,比如有如下sql:"select * from user group by age,sex"。通过调用 _sql/translate发现,生成的聚合是平级的。但是按mysql的执行顺序,应该是sex聚合是age聚合的子聚合。请问这个会是什么原因呢?在手动将group by转换为dsl的时候,是应该转换为多层子聚合的类型吗?如果select子句中有sum(),在构造dsl的时候应该处于group by的多层嵌套聚合的最深一层吗?
  • 2019-10-28
    老师,你好,我现在知道了distinct(count)怎么实现,但是distinct怎么实现呢?比如有1 2 2 3 3 4 5,我想得到1 2 3 4 5
  • 2019-10-14
    请问老师,多次嵌套中,有没有什么办法可以把结果很方便的取出来呢

    就像深度优先搜索一样,叶子级的key表示一行,父级的key作为该行的数据

    难道只能把ES的数据查出后在代码中递归获取吗?
  • 这里我想一下:如果聚合结果之后的数据量大于10000条,那怎么展示10000之后的数据量呢?用from,size吗?
    1
  • 2019-09-21
    分组+聚合,功能强大,玩一把熟悉下!
  • 2019-09-06
    第一种没设置端口可以看到集群:
    bin/elasticsearch -E node.name=node1 -E cluster.name=geektime -E path.data=node1_data

    bin/elasticsearch -E node.name=node2 -E cluster.name=geektime -E path.data=node2_data
    第二种不可以:
    bin/elasticsearch -E node.name=cluster0node -E cluster.name=cluster0 -E path.data=cluster0_data -E discovery.type=single-node -E http.port=9200 -E transport.port=9300

    bin/elasticsearch -E node.name=cluster1node -E cluster.name=cluster1 -E path.data=cluster1_data -E discovery.type=single-node -E http.port=9201 -E transport.port=9301
    展开
    4
  • 2019-09-01
    请问老师,ES对聚合索引的桶数有限制,默认是10000,我们有一个聚合查询需要基于用户id分桶,所以桶数会非常多,这种情况下应当怎么处理呢?谢谢!
  • 2019-08-14
    老师,2个疑问:
    1、请问数据量比较大的情况下,对于这种嵌套分桶的这种情况,怎么才能提高查询速度
    2、一般做聚合的情况很多咋办?是不是又可能会遇到深分页的这种情况?咋处理
    1