Elasticsearch 核心技术与实战
阮一鸣
eBay Pronto 平台技术负责人
66492 人已学习
新⼈⾸单¥68
课程目录
已完结/共 100 讲
第八章:保护你的数据 (3讲)
第十一章:索引生命周期管理 (2讲)
第十二章:用Logstash和Beats构建数据管道 (3讲)
第十三章:用Kibana进行数据可视化分析 (4讲)
实战1:电影搜索服务 (3讲)
实战2:Stackoverflow用户调查问卷分析 (3讲)
备战:Elastic认证 (5讲)
Elasticsearch 核心技术与实战
登录|注册
留言
33
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 24 | 基于词项和基于全文的搜索
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
01 | 课程介绍
02 | 内容综述及学习建议
03 | Elasticsearch简介及其发展历史
04 | Elastic Stack家族成员及其应用场景
05 | Elasticsearch的安装与简单配置
06 | Kibana的安装与界面快速浏览
07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro
08 | Logstash安装与导入数据
09 | 基本概念:索引、文档和REST API
10 | 基本概念:节点、集群、分片及副本
11 | 文档的基本CRUD与批量操作
12 | 倒排索引介绍
13 | 通过Analyzer进行分词
14 | Search API概览
15 | URI Search详解
16 | Request Body与Query DSL简介
17 | Query String&Simple Query String查询
18 | Dynamic Mapping和常见字段类型
19 | 显式Mapping设置与常见参数介绍
20 | 多字段特性及Mapping中配置自定义Analyzer
21 | Index Template和Dynamic Template
22 | Elasticsearch聚合分析简介
23 | 第一部分总结
24 | 基于词项和基于全文的搜索
25 | 结构化搜索
26 | 搜索的相关性算分
27 | Query&Filtering与多字符串多字段查询
28 | 单字符串多字段查询:Dis Max Query
29 | 单字符串多字段查询:Multi Match
30 | 多语言及中文分词与检索
31 | Space Jam,一次全文搜索的实例
32 | 使用Search Template和Index Alias查询
33 | 综合排序:Function Score Query优化算分
34 | Term&Phrase Suggester
35 | 自动补全与基于上下文的提示
36 | 配置跨集群搜索
37 | 集群分布式模型及选主与脑裂问题
38 | 分片与集群的故障转移
39 | 文档分布式存储
40 | 分片及其生命周期
41 | 剖析分布式查询及相关性算分
42 | 排序及Doc Values&Fielddata
43 | 分页与遍历:From, Size, Search After & Scroll API
44 | 处理并发读写操作
45 | Bucket & Metric聚合分析及嵌套聚合
46 | Pipeline聚合分析
47 | 作用范围与排序
48 | 聚合分析的原理及精准度问题
49 | 对象及Nested对象
50 | 文档的父子关系
51 | Update By Query & Reindex API
52 | Ingest Pipeline & Painless Script
53 | Elasticsearch数据建模实例
54 | Elasticsearch数据建模最佳实践
55 | 第二部分总结回顾
56 | 集群身份认证与用户鉴权
57 | 集群内部安全通信
58 | 集群与外部间的安全通信
59 | 常见的集群部署方式
60 | Hot & Warm架构与Shard Filtering
61 | 分片设计及管理
62 | 如何对集群进行容量规划
63 | 在私有云上管理Elasticsearch集群的一些方法
64 | 在公有云上管理与部署Elasticsearch集群
65 | 生产环境常用配置与上线清单
66 | 监控Elasticsearch集群
67 | 诊断集群的潜在问题
68 | 解决集群Yellow与Red的问题
69 | 提升集群写性能
70 | 提升集群读性能
71 | 集群压力测试
72 | 段合并优化及注意事项
73 | 缓存及使用Breaker限制内存使用
74 | 一些运维的相关建议
75 | 使用Shrink与Rollover API有效管理时间序列索引
76 | 索引全生命周期管理及工具介绍
77 | Logstash入门及架构介绍
78 | 利用JDBC插件导入数据到Elasticsearch
79 | Beats介绍
80 | 使用Index Pattern配置数据
81 | 使用Kibana Discover探索数据
82 | 基本可视化组件介绍
83 | 构建Dashboard
84 | 用Monitoring和Alerting监控Elasticsearch集群
85 | 用APM进行程序性能监控
86 | 用机器学习实现时序数据的异常检测(上)
87 | 用机器学习实现时序数据的异常检测(下)
88 | 用ELK进行日志管理
89 | 用Canvas做数据演示
90 | 项目需求分析及架构设计
91 | 将电影数据导入Elasticsearch
92 | 搭建你的电影搜索服务
93 | 需求分析及架构设计
94 | 数据Extract & Enrichment
95 | 构建Insights Dashboard
96 | Elastic认证介绍
97 | 考点梳理
98 | 集群数据备份
99 | 基于Java和Elasticseach构建应用
100 | 结课测试&结束语
本节摘要
登录 后留言

全部留言(33)

  • 最新
  • 精选
cricket1981
ES是如何处理日期类型数据的时区的?

作者回复: date类型是包含时区信息的,如果我们没有在json代表日期的字符串中显式指定时区,对es来说没什么问题, 但是如果通过kibana显示es里的数据时,就会出现问题,数据的时间会晚8个小时。因为kibana从es里读取的date类型数据,没有时区信息, kibana会默认当作0时区来解析,但是kibana在通过浏览器展示的时候,会通过js获取当前客户端机器所在的时区,也就是东八区, 所以kibana会把从es得到的日期数据减去8小时。这里就会导致kibana经常遇到的“数据时间延迟8小时”的问题。 所以最佳实践方案就是:我们在往es提交日期数据的时候,直接提交带有时区信息的日期字符串,如:“2016-07-15T12:58:17.136+0800”。 ##索引中定义的日期格式与提交数据的日期格式要一致,否则会报错。

2019-07-14
2
16
啊瀚
老师有一个问题,term查询是不分词的,哪怕我们设置了该字段的搜索分词也不分吗? match是分词的,哪怕我们没有设置搜索分词也会分吗?

作者回复: 如果字段设置了keyword,你用term查询,就会精确匹配。例如说keyword字段,索引时是“Iphone”,你的term查询必须是Iphone,输入“iphone”就无法匹配。 而如果你的字段是“text”类型。你index时候,如果是“Iphone”,在term查询时,“iphone”可以匹配。但是,“Iphone”不会。很多刚接触的同学会有点困惑。背后的原因是,text类型的数据会分词,默认分词器会将输入一个个单词切开,并且转小写了。所以你 term查询时,必须用“iphone” 如果你是match查询,在text字段上查询iphone或者Iphone 应该都能查到。 课上提供的例子你可以运行测试一下。

2019-07-12
3
8
sdsdkdsj
老师第二部分的pdf麻烦上传下

作者回复: 好的,我让编辑帮我生成后,我github上传。下周一周二吧

2019-07-13
4
6
cricket1981
最后一个课堂问题:对多值字段进行精确匹配提到要用到genre_count组合bool query实现,老师能给个参考实现吗?

作者回复: 看一下这个,建模时,加入了tags_count的字段,然后通过bool 查询中,加入一个filter,过滤tags个数 PUT my_movies/_doc/1 { "title":"movie title action", "tags":["action"], "tags_count":1 } PUT my_movies/_doc/2 { "title":"movie title love", "tags":["action","love"], "tags_count":2 } POST my_movies/_search { "query": { "bool": { "must": [ {"match": { "tags": "action" }} ], "filter": { "term": { "tags_count": 1 } } } } }

2019-07-14
3
无笔秀才
老师,文档上也看到了filter 忽略了算分的步骤,而且可以缓存。那么 我们目前用不到分值是不是可以把条件都写在filter里呢?缓存压力会不会过大,会不会类似oversharding的效果?或者说有哪些负面影响?

作者回复: overshard的意思是,分片数设置过多。能用filter context就尽量不要用query content,应该不存在什么负面影响

2019-07-13
3
小鱼
GET products/_mapping 查看索引的信息,没有看到分词器相关信息,是不是默认在text类型上应用standard的分词器?其他的数据类型boolean,date,long不会分词? { "products" : { "mappings" : { "_doc" : { "properties" : { "avaliable" : { "type" : "boolean" }, "date" : { "type" : "date" }, "price" : { "type" : "long" }, "productID" : { "type" : "text", "fields" : { "keyword" : { "type" : "keyword", "ignore_above" : 256 } } } } } } } }

作者回复: 理解正确。如果你在mapping中指定了其他的分词器,例如“english”,get时就能看到了

2019-07-14
2
Cs
老师好,昨天提了一个问题,今天看了一下执行计划,通过uri方式的get请求,默认都会把text类型的字段进行拆分再转化为小写后,才进行termQuery查询;而RequertBody才是真正意义上的term查询(不会进行处理),很好奇这两种查询方式为什么会有这种差异呢?是否有什么缘由?求解答!

作者回复: dsl里面有term query和match query 两种。term query不分词,match query分词。正事情况下,用rrquest body query结合dsl才是最常见的写法

2019-08-07
1
我是爹
mininum_should_match 这个参数是什么意思,有个 term 和 match 的查询都能使用这个参数吗

作者回复: https://blog.csdn.net/xiao_jun_0820/article/details/51095521

2019-09-16
2
东方奇骥
老师,请教一下计算出的分数score的意义是什么?

作者回复: 越高,说明相关度越高。es默认对搜索结果的算分降序排序

2019-07-29
紫丁香珠
老师,"value": "iPhone" 这个值是es里实际存储的值,为什么查不到呢?//"value":"iphone" 小写的却可以查询到,谢谢~ POST /products/_search { "query": { "term": { "desc": { "value": "iPhone" //"value":"iphone" } } } }

作者回复: 因为desc被分词了(默认分词器还会转小写)。如果要做精确匹配,需要要看keyword类型的字段。

2019-07-18
收起评论