Elasticsearch 核心技术与实战

阮一鸣

eBay Pronto 平台技术负责人

66492 人已学习

新⼈⾸单¥68

课程目录

已完结/共 100 讲

第一章：概述 (4讲)



01 | 课程介绍

时长 04:31

02 | 内容综述及学习建议

时长 06:36

03 | Elasticsearch简介及其发展历史

时长 09:41

04 | Elastic Stack家族成员及其应用场景

时长 11:10

第二章：安装上手 (4讲)



05 | Elasticsearch的安装与简单配置

时长 08:23

06 | Kibana的安装与界面快速浏览

时长 04:54

07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro

时长 04:47

08 | Logstash安装与导入数据

时长 03:59

第三章：Elasticsearch入门 (15讲)



09 | 基本概念：索引、文档和REST API

时长 10:16

10 | 基本概念：节点、集群、分片及副本

时长 16:28

11 | 文档的基本CRUD与批量操作

时长 13:03

12 | 倒排索引介绍

时长 06:16

13 | 通过Analyzer进行分词

时长 12:28

14 | Search API概览

时长 07:29

15 | URI Search详解

时长 11:03

16 | Request Body与Query DSL简介

时长 05:29

17 | Query String&Simple Query String查询

时长 03:18

18 | Dynamic Mapping和常见字段类型

时长 10:40

19 | 显式Mapping设置与常见参数介绍

时长 07:54

20 | 多字段特性及Mapping中配置自定义Analyzer

时长 13:35

21 | Index Template和Dynamic Template

时长 10:18

22 | Elasticsearch聚合分析简介

时长 08:56

23 | 第一部分总结

时长 12:15

第四章：深入搜索 (13讲)



24 | 基于词项和基于全文的搜索

时长 07:14

25 | 结构化搜索

时长 05:14

26 | 搜索的相关性算分

时长 08:50

27 | Query&Filtering与多字符串多字段查询

时长 10:44

28 | 单字符串多字段查询：Dis Max Query

时长 07:24

29 | 单字符串多字段查询：Multi Match

时长 09:51

30 | 多语言及中文分词与检索

时长 12:35

31 | Space Jam，一次全文搜索的实例

时长 09:33

32 | 使用Search Template和Index Alias查询

时长 04:30

33 | 综合排序：Function Score Query优化算分

时长 07:54

34 | Term&Phrase Suggester

时长 05:14

35 | 自动补全与基于上下文的提示

时长 06:59

36 | 配置跨集群搜索

时长 06:35

第五章：分布式特性及分布式搜索的机制 (8讲)



37 | 集群分布式模型及选主与脑裂问题

时长 12:24

38 | 分片与集群的故障转移

时长 05:50

39 | 文档分布式存储

时长 04:22

40 | 分片及其生命周期

时长 07:02

41 | 剖析分布式查询及相关性算分

时长 06:02

42 | 排序及Doc Values&Fielddata

时长 05:21

43 | 分页与遍历：From, Size, Search After & Scroll API

时长 09:13

44 | 处理并发读写操作

时长 05:16

第六章：深入聚合分析 (4讲)



45 | Bucket & Metric聚合分析及嵌套聚合

时长 19:46

46 | Pipeline聚合分析

时长 09:09

47 | 作用范围与排序

时长 10:26

48 | 聚合分析的原理及精准度问题

时长 12:27

第七章：数据建模 (7讲)



49 | 对象及Nested对象

时长 09:13

50 | 文档的父子关系

时长 09:54

51 | Update By Query & Reindex API

时长 09:05

52 | Ingest Pipeline & Painless Script

时长 18:57

53 | Elasticsearch数据建模实例

时长 14:56

54 | Elasticsearch数据建模最佳实践

时长 12:27

55 | 第二部分总结回顾

时长 15:05

第八章：保护你的数据 (3讲)



56 | 集群身份认证与用户鉴权

时长 11:34

57 | 集群内部安全通信

时长 06:09

58 | 集群与外部间的安全通信

时长 07:16

第九章：水平扩展Elasticsearch集群 (6讲)



59 | 常见的集群部署方式

时长 05:43

60 | Hot & Warm架构与Shard Filtering

时长 11:59

61 | 分片设计及管理

时长 06:49

62 | 如何对集群进行容量规划

时长 12:22

63 | 在私有云上管理Elasticsearch集群的一些方法

时长 08:14

64 | 在公有云上管理与部署Elasticsearch集群

时长 09:45

第十章：生产环境中的集群运维 (10讲)



65 | 生产环境常用配置与上线清单

时长 11:19

66 | 监控Elasticsearch集群

时长 05:12

67 | 诊断集群的潜在问题

时长 07:29

68 | 解决集群Yellow与Red的问题

时长 11:53

69 | 提升集群写性能

时长 12:45

70 | 提升集群读性能

时长 05:03

71 | 集群压力测试

时长 09:49

72 | 段合并优化及注意事项

时长 04:11

73 | 缓存及使用Breaker限制内存使用

时长 09:47

74 | 一些运维的相关建议

时长 09:58

第十一章：索引生命周期管理 (2讲)



75 | 使用Shrink与Rollover API有效管理时间序列索引

时长 20:31

76 | 索引全生命周期管理及工具介绍

时长 16:32

第十二章：用Logstash和Beats构建数据管道 (3讲)



77 | Logstash入门及架构介绍

时长 18:11

78 | 利用JDBC插件导入数据到Elasticsearch

时长 13:47

79 | Beats介绍

时长 10:53

第十三章：用Kibana进行数据可视化分析 (4讲)



80 | 使用Index Pattern配置数据

时长 05:10

81 | 使用Kibana Discover探索数据

时长 06:50

82 | 基本可视化组件介绍

时长 16:05

83 | 构建Dashboard

时长 05:52

第十四章：探索X-Pack套件 (6讲)



84 | 用Monitoring和Alerting监控Elasticsearch集群

时长 08:45

85 | 用APM进行程序性能监控

时长 14:32

86 | 用机器学习实现时序数据的异常检测（上）

时长 14:39

87 | 用机器学习实现时序数据的异常检测（下）

时长 08:23

88 | 用ELK进行日志管理

时长 14:37

89 | 用Canvas做数据演示

时长 07:55

实战1：电影搜索服务 (3讲)



90 | 项目需求分析及架构设计

时长 05:38

91 | 将电影数据导入Elasticsearch

时长 06:31

92 | 搭建你的电影搜索服务

时长 13:43

实战2：Stackoverflow用户调查问卷分析 (3讲)



93 | 需求分析及架构设计

时长 03:22

94 | 数据Extract & Enrichment

时长 07:28

95 | 构建Insights Dashboard

时长 04:19

备战：Elastic认证 (5讲)



96 | Elastic认证介绍

时长 08:49

97 | 考点梳理

时长 15:55

98 | 集群数据备份

时长 07:49

99 | 基于Java和Elasticseach构建应用

时长 16:58

100 | 结课测试&结束语

时长 04:48



Elasticsearch 核心技术与实战

登录|注册



留言

27



收藏



沉浸
阅读



分享



手机端



回顶部

当前播放: 43 | 分页与遍历：From, Size, Search After & Scroll API

00:00 / 00:00

高清

高清

1.0x

2.0x
1.5x
1.25x
1.0x
0.75x
0.5x

网页全屏

全屏

00:00

付费课程，可试看



01 | 课程介绍

02 | 内容综述及学习建议

03 | Elasticsearch简介及其发展历史

04 | Elastic Stack家族成员及其应用场景

05 | Elasticsearch的安装与简单配置

06 | Kibana的安装与界面快速浏览

07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro

08 | Logstash安装与导入数据

09 | 基本概念：索引、文档和REST API

10 | 基本概念：节点、集群、分片及副本

11 | 文档的基本CRUD与批量操作

12 | 倒排索引介绍

13 | 通过Analyzer进行分词

14 | Search API概览

15 | URI Search详解

16 | Request Body与Query DSL简介

17 | Query String&Simple Query String查询

18 | Dynamic Mapping和常见字段类型

19 | 显式Mapping设置与常见参数介绍

20 | 多字段特性及Mapping中配置自定义Analyzer

21 | Index Template和Dynamic Template

22 | Elasticsearch聚合分析简介

23 | 第一部分总结

24 | 基于词项和基于全文的搜索

25 | 结构化搜索

26 | 搜索的相关性算分

27 | Query&Filtering与多字符串多字段查询

28 | 单字符串多字段查询：Dis Max Query

29 | 单字符串多字段查询：Multi Match

30 | 多语言及中文分词与检索

31 | Space Jam，一次全文搜索的实例

32 | 使用Search Template和Index Alias查询

33 | 综合排序：Function Score Query优化算分

34 | Term&Phrase Suggester

35 | 自动补全与基于上下文的提示

36 | 配置跨集群搜索

37 | 集群分布式模型及选主与脑裂问题

38 | 分片与集群的故障转移

39 | 文档分布式存储

40 | 分片及其生命周期

41 | 剖析分布式查询及相关性算分

42 | 排序及Doc Values&Fielddata

43 | 分页与遍历：From, Size, Search After & Scroll API

44 | 处理并发读写操作

45 | Bucket & Metric聚合分析及嵌套聚合

46 | Pipeline聚合分析

47 | 作用范围与排序

48 | 聚合分析的原理及精准度问题

49 | 对象及Nested对象

50 | 文档的父子关系

51 | Update By Query & Reindex API

52 | Ingest Pipeline & Painless Script

53 | Elasticsearch数据建模实例

54 | Elasticsearch数据建模最佳实践

55 | 第二部分总结回顾

56 | 集群身份认证与用户鉴权

57 | 集群内部安全通信

58 | 集群与外部间的安全通信

59 | 常见的集群部署方式

60 | Hot & Warm架构与Shard Filtering

61 | 分片设计及管理

62 | 如何对集群进行容量规划

63 | 在私有云上管理Elasticsearch集群的一些方法

64 | 在公有云上管理与部署Elasticsearch集群

65 | 生产环境常用配置与上线清单

66 | 监控Elasticsearch集群

67 | 诊断集群的潜在问题

68 | 解决集群Yellow与Red的问题

69 | 提升集群写性能

70 | 提升集群读性能

71 | 集群压力测试

72 | 段合并优化及注意事项

73 | 缓存及使用Breaker限制内存使用

74 | 一些运维的相关建议

75 | 使用Shrink与Rollover API有效管理时间序列索引

76 | 索引全生命周期管理及工具介绍

77 | Logstash入门及架构介绍

78 | 利用JDBC插件导入数据到Elasticsearch

79 | Beats介绍

80 | 使用Index Pattern配置数据

81 | 使用Kibana Discover探索数据

82 | 基本可视化组件介绍

83 | 构建Dashboard

84 | 用Monitoring和Alerting监控Elasticsearch集群

85 | 用APM进行程序性能监控

86 | 用机器学习实现时序数据的异常检测（上）

87 | 用机器学习实现时序数据的异常检测（下）

88 | 用ELK进行日志管理

89 | 用Canvas做数据演示

90 | 项目需求分析及架构设计

91 | 将电影数据导入Elasticsearch

92 | 搭建你的电影搜索服务

93 | 需求分析及架构设计

94 | 数据Extract & Enrichment

95 | 构建Insights Dashboard

96 | Elastic认证介绍

97 | 考点梳理

98 | 集群数据备份

99 | 基于Java和Elasticseach构建应用

100 | 结课测试&结束语



本节摘要

课件及 Demo 下载地址

https://gitee.com/geektime-geekbang/geektime-ELK

登录后留言

全部留言(27)

最新
精选

yu

老师，scroll分页的scroll=5m这个参数，请问设置有什么讲究么，如果设置了5m，我利用它来做全量数据导出，可能要导15m才能导完，那5m后这个快照就失效了，这时会怎样呢，是重新建立一个快照么

作者回复: 第二次调用的时候还会指定这个参数，所以不会存在说的问题。

2019-08-14



7

王俊杰

老师，spring-data-elasticsearch 支持 search after 吗，我没有找到，java 使用 elasticsearch 使用用那个框架比较好

作者回复: spring data目前支持最高的版本是6.8，7.x的支持你可能还需要稍微等等。 java调用es，可以使用官方提供的high leve java client，是基于官方的low level client开发的

2019-08-11



6

张洋

老师如果数据量特别大用scroll是不是就不合适了，创建快照是把当前index的所有数据快照一份吗？

作者回复: scroll适合大的数据量。缺点就是中间加入的数据不能被读取到。 snapshot是支持指定索引创建的，而且是支持增量的

2019-11-20

2

2

李慕

scroll=5m，请问这个5m或者1m有什么讲究吗？

作者回复: 最好设置的不要过大，在一分钟或5分钟后会失效的意思

2019-08-18



2

sruic

原来的oracle订单数据显示总数和分页，每页十条数据。但表数据是上亿，支持一百万数据分页显示。能改成用es吗

作者回复: 深度分页，并不是搜索引擎所擅长的。google也一样。你应该结合oracle和es一起使用。es用来实现全文检索

2019-08-15

2

2

钱

ES分页查询，老师介绍了几种实现方式，她们各有优缺点： 1：默认查出前十条 2：最多只能查询出1W条，过了就报警 3：from+size 4：search after 查询的数据分布在不同的节点上的分片上，本质是对数据的分库分表的水平切分，那聚合、排序、分页等需要拿到所有数据进行操作的场景必定会复杂一些，有些情况拿出的数据可能超过单机的容量，那估计一定那不出来了，老师，限制最多1万条数据有什么讲究没？

作者回复: 其实想表达的是 ES不适合做搜素的深度分页。 1w条其实就会加载很多数据到内存中，所以可以吧这个参数调的更小，只能说es默认配置相对还比较温和。

2019-09-21





welldo

老师，我还是没太懂 search after 和scroll API是如何解决深度分页带来的性能问题。能再详细一点吗？

2020-04-09

8

8

Turbo

请问如果分页查询需要指定页数的话，Search After 和 Scroll API 都无法满足条件，只能使用 From & Size 的方案了吗，有没有其他性能好一点的方案呢：）

2020-10-16



2

阿里斯托芬

你好你举的关于search_after例子我有些疑问，文档上面写着 “The _id field has a unique value per document but it is not recommended to use it as a tiebreaker directly. doc value are disabled on this field so sorting on it requires to load a lot of data in memory. Instead it is advised to duplicate (client side or with a set ingest processor) the content of the _id field in another field that has doc value enabled and to use this new field as the tiebreaker for the sort.“ 这么说我是实际使用search_after的API，我是需要冗余一个唯一的字段，供search_after使用吗。官方不推荐使用 _id 您是怎么看的

2020-02-29



2

小雅哥

老师好，个人听了还是没理解细节，请教几个问题，谢谢！（1）请问search after是第二次是怎么根据id定位搜索，请问原理是怎样？（2）另外scroll是第一次查询将所有结果缓存到coordinator，后续只查询缓存吗？

2019-08-11

2

2

收起评论