Elasticsearch 核心技术与实战

阮一鸣

eBay Pronto 平台技术负责人

66492 人已学习

新⼈⾸单¥68

课程目录

已完结/共 100 讲

第一章：概述 (4讲)



01 | 课程介绍

时长 04:31

02 | 内容综述及学习建议

时长 06:36

03 | Elasticsearch简介及其发展历史

时长 09:41

04 | Elastic Stack家族成员及其应用场景

时长 11:10

第二章：安装上手 (4讲)



05 | Elasticsearch的安装与简单配置

时长 08:23

06 | Kibana的安装与界面快速浏览

时长 04:54

07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro

时长 04:47

08 | Logstash安装与导入数据

时长 03:59

第三章：Elasticsearch入门 (15讲)



09 | 基本概念：索引、文档和REST API

时长 10:16

10 | 基本概念：节点、集群、分片及副本

时长 16:28

11 | 文档的基本CRUD与批量操作

时长 13:03

12 | 倒排索引介绍

时长 06:16

13 | 通过Analyzer进行分词

时长 12:28

14 | Search API概览

时长 07:29

15 | URI Search详解

时长 11:03

16 | Request Body与Query DSL简介

时长 05:29

17 | Query String&Simple Query String查询

时长 03:18

18 | Dynamic Mapping和常见字段类型

时长 10:40

19 | 显式Mapping设置与常见参数介绍

时长 07:54

20 | 多字段特性及Mapping中配置自定义Analyzer

时长 13:35

21 | Index Template和Dynamic Template

时长 10:18

22 | Elasticsearch聚合分析简介

时长 08:56

23 | 第一部分总结

时长 12:15

第四章：深入搜索 (13讲)



24 | 基于词项和基于全文的搜索

时长 07:14

25 | 结构化搜索

时长 05:14

26 | 搜索的相关性算分

时长 08:50

27 | Query&Filtering与多字符串多字段查询

时长 10:44

28 | 单字符串多字段查询：Dis Max Query

时长 07:24

29 | 单字符串多字段查询：Multi Match

时长 09:51

30 | 多语言及中文分词与检索

时长 12:35

31 | Space Jam，一次全文搜索的实例

时长 09:33

32 | 使用Search Template和Index Alias查询

时长 04:30

33 | 综合排序：Function Score Query优化算分

时长 07:54

34 | Term&Phrase Suggester

时长 05:14

35 | 自动补全与基于上下文的提示

时长 06:59

36 | 配置跨集群搜索

时长 06:35

第五章：分布式特性及分布式搜索的机制 (8讲)



37 | 集群分布式模型及选主与脑裂问题

时长 12:24

38 | 分片与集群的故障转移

时长 05:50

39 | 文档分布式存储

时长 04:22

40 | 分片及其生命周期

时长 07:02

41 | 剖析分布式查询及相关性算分

时长 06:02

42 | 排序及Doc Values&Fielddata

时长 05:21

43 | 分页与遍历：From, Size, Search After & Scroll API

时长 09:13

44 | 处理并发读写操作

时长 05:16

第六章：深入聚合分析 (4讲)



45 | Bucket & Metric聚合分析及嵌套聚合

时长 19:46

46 | Pipeline聚合分析

时长 09:09

47 | 作用范围与排序

时长 10:26

48 | 聚合分析的原理及精准度问题

时长 12:27

第七章：数据建模 (7讲)



49 | 对象及Nested对象

时长 09:13

50 | 文档的父子关系

时长 09:54

51 | Update By Query & Reindex API

时长 09:05

52 | Ingest Pipeline & Painless Script

时长 18:57

53 | Elasticsearch数据建模实例

时长 14:56

54 | Elasticsearch数据建模最佳实践

时长 12:27

55 | 第二部分总结回顾

时长 15:05

第八章：保护你的数据 (3讲)



56 | 集群身份认证与用户鉴权

时长 11:34

57 | 集群内部安全通信

时长 06:09

58 | 集群与外部间的安全通信

时长 07:16

第九章：水平扩展Elasticsearch集群 (6讲)



59 | 常见的集群部署方式

时长 05:43

60 | Hot & Warm架构与Shard Filtering

时长 11:59

61 | 分片设计及管理

时长 06:49

62 | 如何对集群进行容量规划

时长 12:22

63 | 在私有云上管理Elasticsearch集群的一些方法

时长 08:14

64 | 在公有云上管理与部署Elasticsearch集群

时长 09:45

第十章：生产环境中的集群运维 (10讲)



65 | 生产环境常用配置与上线清单

时长 11:19

66 | 监控Elasticsearch集群

时长 05:12

67 | 诊断集群的潜在问题

时长 07:29

68 | 解决集群Yellow与Red的问题

时长 11:53

69 | 提升集群写性能

时长 12:45

70 | 提升集群读性能

时长 05:03

71 | 集群压力测试

时长 09:49

72 | 段合并优化及注意事项

时长 04:11

73 | 缓存及使用Breaker限制内存使用

时长 09:47

74 | 一些运维的相关建议

时长 09:58

第十一章：索引生命周期管理 (2讲)



75 | 使用Shrink与Rollover API有效管理时间序列索引

时长 20:31

76 | 索引全生命周期管理及工具介绍

时长 16:32

第十二章：用Logstash和Beats构建数据管道 (3讲)



77 | Logstash入门及架构介绍

时长 18:11

78 | 利用JDBC插件导入数据到Elasticsearch

时长 13:47

79 | Beats介绍

时长 10:53

第十三章：用Kibana进行数据可视化分析 (4讲)



80 | 使用Index Pattern配置数据

时长 05:10

81 | 使用Kibana Discover探索数据

时长 06:50

82 | 基本可视化组件介绍

时长 16:05

83 | 构建Dashboard

时长 05:52

第十四章：探索X-Pack套件 (6讲)



84 | 用Monitoring和Alerting监控Elasticsearch集群

时长 08:45

85 | 用APM进行程序性能监控

时长 14:32

86 | 用机器学习实现时序数据的异常检测（上）

时长 14:39

87 | 用机器学习实现时序数据的异常检测（下）

时长 08:23

88 | 用ELK进行日志管理

时长 14:37

89 | 用Canvas做数据演示

时长 07:55

实战1：电影搜索服务 (3讲)



90 | 项目需求分析及架构设计

时长 05:38

91 | 将电影数据导入Elasticsearch

时长 06:31

92 | 搭建你的电影搜索服务

时长 13:43

实战2：Stackoverflow用户调查问卷分析 (3讲)



93 | 需求分析及架构设计

时长 03:22

94 | 数据Extract & Enrichment

时长 07:28

95 | 构建Insights Dashboard

时长 04:19

备战：Elastic认证 (5讲)



96 | Elastic认证介绍

时长 08:49

97 | 考点梳理

时长 15:55

98 | 集群数据备份

时长 07:49

99 | 基于Java和Elasticseach构建应用

时长 16:58

100 | 结课测试&结束语

时长 04:48



Elasticsearch 核心技术与实战

登录|注册



留言

15



收藏



沉浸
阅读



分享



手机端



回顶部

当前播放: 41 | 剖析分布式查询及相关性算分

00:00 / 00:00

高清

高清

1.0x

2.0x
1.5x
1.25x
1.0x
0.75x
0.5x

网页全屏

全屏

00:00

付费课程，可试看



01 | 课程介绍

02 | 内容综述及学习建议

03 | Elasticsearch简介及其发展历史

04 | Elastic Stack家族成员及其应用场景

05 | Elasticsearch的安装与简单配置

06 | Kibana的安装与界面快速浏览

07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro

08 | Logstash安装与导入数据

09 | 基本概念：索引、文档和REST API

10 | 基本概念：节点、集群、分片及副本

11 | 文档的基本CRUD与批量操作

12 | 倒排索引介绍

13 | 通过Analyzer进行分词

14 | Search API概览

15 | URI Search详解

16 | Request Body与Query DSL简介

17 | Query String&Simple Query String查询

18 | Dynamic Mapping和常见字段类型

19 | 显式Mapping设置与常见参数介绍

20 | 多字段特性及Mapping中配置自定义Analyzer

21 | Index Template和Dynamic Template

22 | Elasticsearch聚合分析简介

23 | 第一部分总结

24 | 基于词项和基于全文的搜索

25 | 结构化搜索

26 | 搜索的相关性算分

27 | Query&Filtering与多字符串多字段查询

28 | 单字符串多字段查询：Dis Max Query

29 | 单字符串多字段查询：Multi Match

30 | 多语言及中文分词与检索

31 | Space Jam，一次全文搜索的实例

32 | 使用Search Template和Index Alias查询

33 | 综合排序：Function Score Query优化算分

34 | Term&Phrase Suggester

35 | 自动补全与基于上下文的提示

36 | 配置跨集群搜索

37 | 集群分布式模型及选主与脑裂问题

38 | 分片与集群的故障转移

39 | 文档分布式存储

40 | 分片及其生命周期

41 | 剖析分布式查询及相关性算分

42 | 排序及Doc Values&Fielddata

43 | 分页与遍历：From, Size, Search After & Scroll API

44 | 处理并发读写操作

45 | Bucket & Metric聚合分析及嵌套聚合

46 | Pipeline聚合分析

47 | 作用范围与排序

48 | 聚合分析的原理及精准度问题

49 | 对象及Nested对象

50 | 文档的父子关系

51 | Update By Query & Reindex API

52 | Ingest Pipeline & Painless Script

53 | Elasticsearch数据建模实例

54 | Elasticsearch数据建模最佳实践

55 | 第二部分总结回顾

56 | 集群身份认证与用户鉴权

57 | 集群内部安全通信

58 | 集群与外部间的安全通信

59 | 常见的集群部署方式

60 | Hot & Warm架构与Shard Filtering

61 | 分片设计及管理

62 | 如何对集群进行容量规划

63 | 在私有云上管理Elasticsearch集群的一些方法

64 | 在公有云上管理与部署Elasticsearch集群

65 | 生产环境常用配置与上线清单

66 | 监控Elasticsearch集群

67 | 诊断集群的潜在问题

68 | 解决集群Yellow与Red的问题

69 | 提升集群写性能

70 | 提升集群读性能

71 | 集群压力测试

72 | 段合并优化及注意事项

73 | 缓存及使用Breaker限制内存使用

74 | 一些运维的相关建议

75 | 使用Shrink与Rollover API有效管理时间序列索引

76 | 索引全生命周期管理及工具介绍

77 | Logstash入门及架构介绍

78 | 利用JDBC插件导入数据到Elasticsearch

79 | Beats介绍

80 | 使用Index Pattern配置数据

81 | 使用Kibana Discover探索数据

82 | 基本可视化组件介绍

83 | 构建Dashboard

84 | 用Monitoring和Alerting监控Elasticsearch集群

85 | 用APM进行程序性能监控

86 | 用机器学习实现时序数据的异常检测（上）

87 | 用机器学习实现时序数据的异常检测（下）

88 | 用ELK进行日志管理

89 | 用Canvas做数据演示

90 | 项目需求分析及架构设计

91 | 将电影数据导入Elasticsearch

92 | 搭建你的电影搜索服务

93 | 需求分析及架构设计

94 | 数据Extract & Enrichment

95 | 构建Insights Dashboard

96 | Elastic认证介绍

97 | 考点梳理

98 | 集群数据备份

99 | 基于Java和Elasticseach构建应用

100 | 结课测试&结束语



本节摘要

课件及 Demo 下载地址

https://gitee.com/geektime-geekbang/geektime-ELK

登录后留言

全部留言(15)

最新
精选

icer

如果文档存在P2中，但是随机选择的时候选择了P0 R1 P1上会查不到数据，会继续随机查询吗

作者回复: 目前基于id查找是会通过hash函数定位到具体的shard分片上的。所以不会存在找不到。并不是随机的

2019-10-08

3

4

felicity

from+size，from是什么,size是什么，感觉很多都不说啊，听的很吃力

作者回复: from是指从哪条开始，size指取几条结果

2020-04-02

5

2

Geek_5b8961

老师好，es是否支持按某个字段来分区？比如三个商品 name:苹果，cat:水果；name:苹果,cat:电子产品；name:苹果,cat:衣服。当这些商品在不同的shards上时，同个cat下苹果的tfidf可能会不一样。如果能控制每个shards下的cat尽量一致，那么我就能保证按cat过滤时苹果的tfidf是一样的

作者回复: 1你可以指定自己的routing，将数据路由到具体的shard上，这样可以解决算分在不同分片的问题，因为算分tf没问题，idf是基于分片的。

2019-08-12

3

1

箭飞天

老师，请问下，demo中，如果设置分片为20，三条数据都在不同分片，为啥查询的时候，他们算分一样呢？算分整体不是应该保持：匹配词长/字段总长度？

2020-05-03

1

2

Sam Fu

⽤户发出搜索请求到 ES 节点。节点收到请求后，会以 Coordinating 节点的身份，在 6 个主副分⽚中随机选择 3 个分⽚，发送查询请求 -------------- 搜索请求到ES节点。这里的ES节点是任意一个节点吗？在6个主副分片中随机选择3个，是怎么随机选择，R0，P0，R1 任意都可以吗？那取不到数据怎么办呢，继续路由吗？

2022-02-26



1

钱

这节好，总于大体明白了搜索的过程，搜索分为两步，query+fetch，查询一些信息，毕竟不知道在哪里，可能存储在任意分片上，所以，少不得去每个分片都搜索一次，然后再汇总，然后再去获取详细的信息。分布式数据库，本质上感觉就是对数据的水平分库分表，关系型数据库需要自己玩，分布式的数据库自己实现了，所以，才敢号称天然支持水平扩展。kv数据库通过k路由到对应的节点，es通过指定路由ID或者使用文档ID的方式来路由到不同的节点，在kv数据库中key需要集群唯一，哪在es中文档ID需要集群唯一嘛？感觉索引下唯一就行，如果需要支持跨索引查询，则需要集群唯一？老师能给分析分析嘛？

2019-09-21

1

1

Joseph

这里每个分片返回from~from+size条记录，应该是错了。

2023-05-21





Geek_LIAO

为什么query阶段是返回 from+size个文档？

2023-05-20





Geek_945270

数据量很小有大概的范围吗多少算比较小

2021-05-25





祥俊

老师，想问下，如果是多个分片的话，执行分页查询，会不会出现下一页数据和上一页数据有重复？毕竟是多个分片进行查询，比如按照I’d进行排序

2020-09-25





收起评论