Elasticsearch 核心技术与实战
阮一鸣
eBay Pronto 平台技术负责人
66492 人已学习
新⼈⾸单¥68
课程目录
已完结/共 100 讲
第八章:保护你的数据 (3讲)
第十一章:索引生命周期管理 (2讲)
第十二章:用Logstash和Beats构建数据管道 (3讲)
第十三章:用Kibana进行数据可视化分析 (4讲)
实战1:电影搜索服务 (3讲)
实战2:Stackoverflow用户调查问卷分析 (3讲)
备战:Elastic认证 (5讲)
Elasticsearch 核心技术与实战
登录|注册
留言
22
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 59 | 常见的集群部署方式
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
01 | 课程介绍
02 | 内容综述及学习建议
03 | Elasticsearch简介及其发展历史
04 | Elastic Stack家族成员及其应用场景
05 | Elasticsearch的安装与简单配置
06 | Kibana的安装与界面快速浏览
07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro
08 | Logstash安装与导入数据
09 | 基本概念:索引、文档和REST API
10 | 基本概念:节点、集群、分片及副本
11 | 文档的基本CRUD与批量操作
12 | 倒排索引介绍
13 | 通过Analyzer进行分词
14 | Search API概览
15 | URI Search详解
16 | Request Body与Query DSL简介
17 | Query String&Simple Query String查询
18 | Dynamic Mapping和常见字段类型
19 | 显式Mapping设置与常见参数介绍
20 | 多字段特性及Mapping中配置自定义Analyzer
21 | Index Template和Dynamic Template
22 | Elasticsearch聚合分析简介
23 | 第一部分总结
24 | 基于词项和基于全文的搜索
25 | 结构化搜索
26 | 搜索的相关性算分
27 | Query&Filtering与多字符串多字段查询
28 | 单字符串多字段查询:Dis Max Query
29 | 单字符串多字段查询:Multi Match
30 | 多语言及中文分词与检索
31 | Space Jam,一次全文搜索的实例
32 | 使用Search Template和Index Alias查询
33 | 综合排序:Function Score Query优化算分
34 | Term&Phrase Suggester
35 | 自动补全与基于上下文的提示
36 | 配置跨集群搜索
37 | 集群分布式模型及选主与脑裂问题
38 | 分片与集群的故障转移
39 | 文档分布式存储
40 | 分片及其生命周期
41 | 剖析分布式查询及相关性算分
42 | 排序及Doc Values&Fielddata
43 | 分页与遍历:From, Size, Search After & Scroll API
44 | 处理并发读写操作
45 | Bucket & Metric聚合分析及嵌套聚合
46 | Pipeline聚合分析
47 | 作用范围与排序
48 | 聚合分析的原理及精准度问题
49 | 对象及Nested对象
50 | 文档的父子关系
51 | Update By Query & Reindex API
52 | Ingest Pipeline & Painless Script
53 | Elasticsearch数据建模实例
54 | Elasticsearch数据建模最佳实践
55 | 第二部分总结回顾
56 | 集群身份认证与用户鉴权
57 | 集群内部安全通信
58 | 集群与外部间的安全通信
59 | 常见的集群部署方式
60 | Hot & Warm架构与Shard Filtering
61 | 分片设计及管理
62 | 如何对集群进行容量规划
63 | 在私有云上管理Elasticsearch集群的一些方法
64 | 在公有云上管理与部署Elasticsearch集群
65 | 生产环境常用配置与上线清单
66 | 监控Elasticsearch集群
67 | 诊断集群的潜在问题
68 | 解决集群Yellow与Red的问题
69 | 提升集群写性能
70 | 提升集群读性能
71 | 集群压力测试
72 | 段合并优化及注意事项
73 | 缓存及使用Breaker限制内存使用
74 | 一些运维的相关建议
75 | 使用Shrink与Rollover API有效管理时间序列索引
76 | 索引全生命周期管理及工具介绍
77 | Logstash入门及架构介绍
78 | 利用JDBC插件导入数据到Elasticsearch
79 | Beats介绍
80 | 使用Index Pattern配置数据
81 | 使用Kibana Discover探索数据
82 | 基本可视化组件介绍
83 | 构建Dashboard
84 | 用Monitoring和Alerting监控Elasticsearch集群
85 | 用APM进行程序性能监控
86 | 用机器学习实现时序数据的异常检测(上)
87 | 用机器学习实现时序数据的异常检测(下)
88 | 用ELK进行日志管理
89 | 用Canvas做数据演示
90 | 项目需求分析及架构设计
91 | 将电影数据导入Elasticsearch
92 | 搭建你的电影搜索服务
93 | 需求分析及架构设计
94 | 数据Extract & Enrichment
95 | 构建Insights Dashboard
96 | Elastic认证介绍
97 | 考点梳理
98 | 集群数据备份
99 | 基于Java和Elasticseach构建应用
100 | 结课测试&结束语
本节摘要
登录 后留言

全部留言(22)

  • 最新
  • 精选
刘阳
老师好。生产环境下,针对不同类型(master/data/ingest)的节点,是否分别有相应的推荐的具体一些的机器硬件配置(cpu/memory/disk)?视频中提到的high/medium/low有一些笼统。 还有就是es版本的选择,对于新建的生产集群,是推荐选择官方的新版本,还是相对来说有一定成熟度的老的大版本?7.x版本当前时间节点在生产环境使用是否相对6.x有一些风险?

作者回复: 这个在后续的容量规划等几节中有相关的讲解。 版本建议最好能做升级。但是不建议使用最新的版本。 贴一个elastic给我关于版本的讨论。他们推荐倒推4到6个月。 I completely understand that stability is the most important concern. In that case, we should not choose the latest version of Elasticsearch. For reference, all the current and past releases can be found on this page: https://www.elastic.co/downloads/past-releases#elasticsearch. I would recommend choosing a 7.x version. Version 7.1.1 has been out since May 29 and is stable. That might be a good choice. As a pattern, I would suggest staying 4 - 6 months behind the latest version.

2019-09-05
4
Allen钱
GTM是啥的缩写啊?

作者回复: Global Traffic Manager,一种负载均衡

2019-09-01
4
xxx
老师,生产环境使用k8s部署集群,有没有什么好的方案和建议呢?目前使用helm方式部署

作者回复: 还可以考虑使用elastic官方最近开源的k8s operator

2020-03-18
2
2
弘毅
老师,我想咨询下,es节点按职责划分后,es客户端连接的es节点列表应该如何配置呢?

作者回复: 我们是通过在这些节点的前端设置一个用来写数据的负载均衡,一个读数据的负载均衡。然后将数据的读写逻辑分别配置到这两个loadbalancer上

2020-02-11
2
bruce
老师,如果有创建索引的请求发送到了coordinating节点上,会被coordinating节点转发到master节点上么?

作者回复: 索引的创建,都需要通过master节点执行的

2019-09-15
2
yzlyzt
老师,请问ES集群,操作系统磁盘使用RAID5还是RAID0,或者裸盘,哪个性能最好?

作者回复: 理论上不需要做raid。 存储推荐使用ssd,在warm节点机械盘可以考虑。网络存储不推荐。

2019-09-06
2
老师elasticsearch还有GTM来支持多写吗

作者回复: GTM主要用来做数据的读取。在多个data center的部署场景。gtm背后是几个相同的集群。这几个集群需要确保有相似的数据。所以,你需要程序分别写入这几个集群,保持数据一致。或者就写入一个集群,使用es的跨集群复制确保数据一致。

2019-09-04
2
Ryoma
默认主分片只有一个,在当前索引数据存储为 80GB 的情况下,是不是应该重建索引,设置成多分片了。另外,每个分片支撑多大是比较合适的,以 4核 32 G 的机器为例。

作者回复: 你需要提前做容量规划,如果估计到索引中数据量比较大。建议将分片主分片设置成一个合适的数字。简单来说 搜索20g 一个分片,日志40g 以内。你可以通过reindex 重新设置分片数。当然也可以考虑使用split api,(需要先设置成只读,一般在warm 阶段做split更加合适)

2019-09-06
1
老师,请教一个问题,看评论中老师多次提到一个主分片在30g左右是合适的,我想问一下ES的存储消耗主要花在哪里,假如30G的空间最多存储的数据应该不会到30G吧?目前还有一个疑惑一直没搞懂,ES的倒排索引中是会存储所有数据还是只是分词后和文档ID的关联关系的数据?
2019-09-22
1
1
BLESSLH
GTM 是什么,能实现数据的同步写吗
2022-11-07
收起评论