Elasticsearch 核心技术与实战
阮一鸣
eBay Pronto 平台技术负责人
66492 人已学习
新⼈⾸单¥68
课程目录
已完结/共 100 讲
第八章:保护你的数据 (3讲)
第十一章:索引生命周期管理 (2讲)
第十二章:用Logstash和Beats构建数据管道 (3讲)
第十三章:用Kibana进行数据可视化分析 (4讲)
实战1:电影搜索服务 (3讲)
实战2:Stackoverflow用户调查问卷分析 (3讲)
备战:Elastic认证 (5讲)
Elasticsearch 核心技术与实战
登录|注册
留言
99+
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 13 | 通过Analyzer进行分词
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
01 | 课程介绍
02 | 内容综述及学习建议
03 | Elasticsearch简介及其发展历史
04 | Elastic Stack家族成员及其应用场景
05 | Elasticsearch的安装与简单配置
06 | Kibana的安装与界面快速浏览
07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro
08 | Logstash安装与导入数据
09 | 基本概念:索引、文档和REST API
10 | 基本概念:节点、集群、分片及副本
11 | 文档的基本CRUD与批量操作
12 | 倒排索引介绍
13 | 通过Analyzer进行分词
14 | Search API概览
15 | URI Search详解
16 | Request Body与Query DSL简介
17 | Query String&Simple Query String查询
18 | Dynamic Mapping和常见字段类型
19 | 显式Mapping设置与常见参数介绍
20 | 多字段特性及Mapping中配置自定义Analyzer
21 | Index Template和Dynamic Template
22 | Elasticsearch聚合分析简介
23 | 第一部分总结
24 | 基于词项和基于全文的搜索
25 | 结构化搜索
26 | 搜索的相关性算分
27 | Query&Filtering与多字符串多字段查询
28 | 单字符串多字段查询:Dis Max Query
29 | 单字符串多字段查询:Multi Match
30 | 多语言及中文分词与检索
31 | Space Jam,一次全文搜索的实例
32 | 使用Search Template和Index Alias查询
33 | 综合排序:Function Score Query优化算分
34 | Term&Phrase Suggester
35 | 自动补全与基于上下文的提示
36 | 配置跨集群搜索
37 | 集群分布式模型及选主与脑裂问题
38 | 分片与集群的故障转移
39 | 文档分布式存储
40 | 分片及其生命周期
41 | 剖析分布式查询及相关性算分
42 | 排序及Doc Values&Fielddata
43 | 分页与遍历:From, Size, Search After & Scroll API
44 | 处理并发读写操作
45 | Bucket & Metric聚合分析及嵌套聚合
46 | Pipeline聚合分析
47 | 作用范围与排序
48 | 聚合分析的原理及精准度问题
49 | 对象及Nested对象
50 | 文档的父子关系
51 | Update By Query & Reindex API
52 | Ingest Pipeline & Painless Script
53 | Elasticsearch数据建模实例
54 | Elasticsearch数据建模最佳实践
55 | 第二部分总结回顾
56 | 集群身份认证与用户鉴权
57 | 集群内部安全通信
58 | 集群与外部间的安全通信
59 | 常见的集群部署方式
60 | Hot & Warm架构与Shard Filtering
61 | 分片设计及管理
62 | 如何对集群进行容量规划
63 | 在私有云上管理Elasticsearch集群的一些方法
64 | 在公有云上管理与部署Elasticsearch集群
65 | 生产环境常用配置与上线清单
66 | 监控Elasticsearch集群
67 | 诊断集群的潜在问题
68 | 解决集群Yellow与Red的问题
69 | 提升集群写性能
70 | 提升集群读性能
71 | 集群压力测试
72 | 段合并优化及注意事项
73 | 缓存及使用Breaker限制内存使用
74 | 一些运维的相关建议
75 | 使用Shrink与Rollover API有效管理时间序列索引
76 | 索引全生命周期管理及工具介绍
77 | Logstash入门及架构介绍
78 | 利用JDBC插件导入数据到Elasticsearch
79 | Beats介绍
80 | 使用Index Pattern配置数据
81 | 使用Kibana Discover探索数据
82 | 基本可视化组件介绍
83 | 构建Dashboard
84 | 用Monitoring和Alerting监控Elasticsearch集群
85 | 用APM进行程序性能监控
86 | 用机器学习实现时序数据的异常检测(上)
87 | 用机器学习实现时序数据的异常检测(下)
88 | 用ELK进行日志管理
89 | 用Canvas做数据演示
90 | 项目需求分析及架构设计
91 | 将电影数据导入Elasticsearch
92 | 搭建你的电影搜索服务
93 | 需求分析及架构设计
94 | 数据Extract & Enrichment
95 | 构建Insights Dashboard
96 | Elastic认证介绍
97 | 考点梳理
98 | 集群数据备份
99 | 基于Java和Elasticseach构建应用
100 | 结课测试&结束语
登录 后留言

全部留言(101)

  • 最新
  • 精选
老男孩
老师,建议以后加一节java整合es的课

作者回复: 好的,记下这个需求了。之前没有这方面的计划。目前有收到2位同学提出这方面的需要了。

2019-07-02
18
90
有铭
给各位使用docker跑Elasticsearch安装插件的简单办法,无需dockerFile自制镜像。以本帖的双es启动为例: 1.进入es的容器并启动bash。 命令 docker exec -it es7_01 bash 注:es7_01 即容器名称 2..第一步成功你会发现你已经在容器内部,此时输入 pwd 命令会发现自己处于/usr/share/elasticsearch 路径。此时即可输入插件安装命令 bin/elasticsearch-plugin install analysis-icu 等待插件下载并安装完毕 3.输入exit退出容器bash。 4.如法炮制es7_02并安装插件。 5.docker-compose restart 重启容器 6.重启后,检查安装是否成功,输入 curl 127.0.0.1:9200/_cat/plugins,输出: es7_01 analysis-icu 7.2.0 es7_02 analysis-icu 7.2.0 代表成功

作者回复: 非常棒的分享。这样操作更为方便。

2019-07-06
10
53
.两个调味罐
老师,课后面会教怎么和java或者springboot整合吗?

作者回复: 暂时没有这个计划。如果有很多同学有这个需求,我可以➕一节

2019-07-01
9
48
天琪
ik分析器安装: bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.1.0/elasticsearch-analysis-ik-7.1.0.zip kibana 演示: POST _analyze { "analyzer": "ik_smart", "text": "中华人民共和国国歌" } POST _analyze { "analyzer": "ik_max_word", "text": "中华人民共和国国歌" } ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合,适合 Term Query; ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”,适合 Phrase 查询

作者回复: 谢谢分享!

2019-07-01
5
31
王俊杰
老师,建议以后加一节java整合es的课

作者回复: 👌

2019-07-02
2
21
Dev.M
老师讲得很好,不过更新速度有些慢呀

作者回复: 可以多看一些相关文档,自己多做一些练习。争取夯基础,一下看很多的内容也未必一下记得住,细水长流,贵在坚持。

2019-07-02
8
施小江
老师,你好,能不能保持每天或者隔天更新一到两集,这样可以保持一个学习的习惯。

作者回复: 具体的更新节奏,编辑同学会有所控制,已经录制了一部分课程

2019-07-01
7
无笔秀才
其实个人项目中已经在重度使用es,也遇到了一些问题,购买课程主要是想向老师学习,并请教一些问题的解决方案。 1. 自动创建的mapping 如text.keyword 后面如果想修改怎么办,比如按月分 index_201901/ index_201902 ,那么新旧不一致,导致查询语句 也不一致。 如: "title": { "type": "text", "fields": { "keyword": { "type": "keyword", "ignore_above": 256 } } } 现在想改成 "title": { "type": "keyword" } 由于之前的查询语句都已经写成title.keyword了。 如果修改了之后就会导致index_201901 - index_201906都是带keyword的。但是index_201907及以后的都都是不带keyword的。这种情况是需要将前面的index数据先备份,再删除重新建立mapping 再导入原来的数据吗? 2. 由于需求要对某些字段(如title)进行复杂条件查询,and / or ,我就想到了query_string, 查找性能较慢。有时候甚至会超时。 3. 副本数设置的多,那么稳定性就会增强,那么势必会造成同步的成本,这里想跟老师确认一下副本同步过程是强一致性,还是最终一致性?一个写请求过来,是等所有副本都同步完了 才返回给客户端,还是先把主节点操作完成就返回主节点呢?我个人感觉应该是强一致性。不然副本同步失败 也无法通知客户端了。 4. 我们现在想存文章正文但是不想分词,于是我就设置成了如下格式。但是遇到了一些变态文章很长,超长了。就会写入失败,而不是被截断。再确认一点我看文档说 ignore_above 设置的是字节数,而不是字数。 "content": { "type": "keyword", "ignore_above": 20000 } 5. 在课程中也发现ik分词可以自定义词库等,这里有一个疑惑就算是用自己的词库,那么加入当发现一个新词的时候,我需要热更新自定义词库,这时候文章已经写入es了,但还是按照旧的词库去分词的。 还有热更新词库会不会较慢影响读写性能。以至于要停机更新? 多谢老师指教

作者回复: 1. mapping修改,需要做reindex。基于时间序列的index可以结合index template来创建。可以配置index alias来解决index改名产生的问题 。 2查询的性能问题,你能给出具体的例子吗?否则我不知道如何回答 3. 分片数的设定 ,读写文件的流程。在后续会做讲解。简单来说,如果写入频率不高,设置多个副本会提升读取性能 4. 我觉得你不应该设置keyword,而是应该在mapoing中将那个字段设置成ignore。 5.ik和hanlp等分析器 支持词库的动态更新的。后续课程会讲。 希望这些简单的回答对你有用。

2019-06-30
6
暖色浮余生
我也提一下spring boot整个es😬

作者回复: ➕1

2019-07-08
4
千里之行 始于足下
我也需要Java整合ES的,我是用的springCloud,谢谢老师

作者回复: 好!

2019-07-05
4
收起评论