Elasticsearch 核心技术与实战
阮一鸣
eBay Pronto 平台技术负责人
66492 人已学习
新⼈⾸单¥68
课程目录
已完结/共 100 讲
第八章:保护你的数据 (3讲)
第十一章:索引生命周期管理 (2讲)
第十二章:用Logstash和Beats构建数据管道 (3讲)
第十三章:用Kibana进行数据可视化分析 (4讲)
实战1:电影搜索服务 (3讲)
实战2:Stackoverflow用户调查问卷分析 (3讲)
备战:Elastic认证 (5讲)
Elasticsearch 核心技术与实战
登录|注册
留言
14
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 62 | 如何对集群进行容量规划
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
01 | 课程介绍
02 | 内容综述及学习建议
03 | Elasticsearch简介及其发展历史
04 | Elastic Stack家族成员及其应用场景
05 | Elasticsearch的安装与简单配置
06 | Kibana的安装与界面快速浏览
07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro
08 | Logstash安装与导入数据
09 | 基本概念:索引、文档和REST API
10 | 基本概念:节点、集群、分片及副本
11 | 文档的基本CRUD与批量操作
12 | 倒排索引介绍
13 | 通过Analyzer进行分词
14 | Search API概览
15 | URI Search详解
16 | Request Body与Query DSL简介
17 | Query String&Simple Query String查询
18 | Dynamic Mapping和常见字段类型
19 | 显式Mapping设置与常见参数介绍
20 | 多字段特性及Mapping中配置自定义Analyzer
21 | Index Template和Dynamic Template
22 | Elasticsearch聚合分析简介
23 | 第一部分总结
24 | 基于词项和基于全文的搜索
25 | 结构化搜索
26 | 搜索的相关性算分
27 | Query&Filtering与多字符串多字段查询
28 | 单字符串多字段查询:Dis Max Query
29 | 单字符串多字段查询:Multi Match
30 | 多语言及中文分词与检索
31 | Space Jam,一次全文搜索的实例
32 | 使用Search Template和Index Alias查询
33 | 综合排序:Function Score Query优化算分
34 | Term&Phrase Suggester
35 | 自动补全与基于上下文的提示
36 | 配置跨集群搜索
37 | 集群分布式模型及选主与脑裂问题
38 | 分片与集群的故障转移
39 | 文档分布式存储
40 | 分片及其生命周期
41 | 剖析分布式查询及相关性算分
42 | 排序及Doc Values&Fielddata
43 | 分页与遍历:From, Size, Search After & Scroll API
44 | 处理并发读写操作
45 | Bucket & Metric聚合分析及嵌套聚合
46 | Pipeline聚合分析
47 | 作用范围与排序
48 | 聚合分析的原理及精准度问题
49 | 对象及Nested对象
50 | 文档的父子关系
51 | Update By Query & Reindex API
52 | Ingest Pipeline & Painless Script
53 | Elasticsearch数据建模实例
54 | Elasticsearch数据建模最佳实践
55 | 第二部分总结回顾
56 | 集群身份认证与用户鉴权
57 | 集群内部安全通信
58 | 集群与外部间的安全通信
59 | 常见的集群部署方式
60 | Hot & Warm架构与Shard Filtering
61 | 分片设计及管理
62 | 如何对集群进行容量规划
63 | 在私有云上管理Elasticsearch集群的一些方法
64 | 在公有云上管理与部署Elasticsearch集群
65 | 生产环境常用配置与上线清单
66 | 监控Elasticsearch集群
67 | 诊断集群的潜在问题
68 | 解决集群Yellow与Red的问题
69 | 提升集群写性能
70 | 提升集群读性能
71 | 集群压力测试
72 | 段合并优化及注意事项
73 | 缓存及使用Breaker限制内存使用
74 | 一些运维的相关建议
75 | 使用Shrink与Rollover API有效管理时间序列索引
76 | 索引全生命周期管理及工具介绍
77 | Logstash入门及架构介绍
78 | 利用JDBC插件导入数据到Elasticsearch
79 | Beats介绍
80 | 使用Index Pattern配置数据
81 | 使用Kibana Discover探索数据
82 | 基本可视化组件介绍
83 | 构建Dashboard
84 | 用Monitoring和Alerting监控Elasticsearch集群
85 | 用APM进行程序性能监控
86 | 用机器学习实现时序数据的异常检测(上)
87 | 用机器学习实现时序数据的异常检测(下)
88 | 用ELK进行日志管理
89 | 用Canvas做数据演示
90 | 项目需求分析及架构设计
91 | 将电影数据导入Elasticsearch
92 | 搭建你的电影搜索服务
93 | 需求分析及架构设计
94 | 数据Extract & Enrichment
95 | 构建Insights Dashboard
96 | Elastic认证介绍
97 | 考点梳理
98 | 集群数据备份
99 | 基于Java和Elasticseach构建应用
100 | 结课测试&结束语
登录 后留言

全部留言(14)

  • 最新
  • 精选
张红泽
老师我们现在一个索引10个主分片,现在每个主分片80g,现在我们需要增加分片数量,增加到 100个,会造成集群查询变慢吗

作者回复: 单个分片的尺寸最好控制在50G以下。单台机器,每一个G的内存,分配20个以下的分片。 你现在突然将主分片扩到100个,每个上面只有8g,这肯定是over sharding了

2019-10-17
3
3
飞飞
请教老师,我们的项目上单表已经达到6t,目前是250多个分片,有什么好的机制能实现更快的数据入库么?

作者回复: 数据入库如果为了提高写性能,可以参考提高写性能一节。总体来说可以通过修改refresh和translog,牺牲查询实时性和数据稳定性提高tps。 单表数据6t 如果要写入索引,如果是时间序列数据,可以建立timebase的index。如果不是,可以考虑按照字段进行划分索引,例如按照订单的地区,cn,us,划分不同的索引。然后,当然索引得主分片,确保单个分片的尺寸在30g以下

2019-09-09
2
3
makermade
老师好,基于time-based index设计日志类存储,假设按月拆分index, 如log_2020-01、log_2020-02, ES服务端(或者提供API)可以配置自动删除的历史的index吗?还是说应用层需要按保留的逻辑,定时去删除。

作者回复: 可以通过配置ILM 定期删除

2020-03-22
2
2
MrPolo
請教老師,我們目前在生產環境使用的protocol是transport的方式,不是RESTFul API,請問這樣的狀況下增加coordinate node 做查詢的load banlancer是有用嗎的?

作者回复: lb是基于9200走的http。transport走的是9300,估计你是通过将一组node的ip加入配置文件来实现的吧?这种情况下,通过增加节点也可以实现水平扩展

2019-11-06
2
makermade
问句题外话: 请问大佬,容量规划是由业务方,运维同学,开发人员一起来讨论敲定的吗

作者回复: 业务和开发提供需要的query,es保存的数据量。然后选择合适的部署和节点。上线前进行相应的性能测试

2020-02-29
2
金hb.Ryan 冷空氣駕到
请问hot warm架构会介绍么

作者回复: 有介绍的

2019-09-19
天然
我们单节点24核cpu、128G内存、36Tes数据存储。是不是可以在这台服务器上创建2个节点?目前一台要数据控制在5T一下,客户根本不给这么多服务器,是不是可以要个大cpu、大内存的服务器,在单台服务器上多建节点?分散下每个节点的数据量?
2022-03-23
L
请教老师,我这目前是三台物理机(没有ssd)每天每个索引量大概在2.2T左右,目前是5个分片,数据写入已经将服务器io打满了,请问我如果更改分片数量可以解决我这写入的问题吗?
2021-07-28
👨🏻‍🏫
老师您好,在生产环境中有快速定位异常节点的方法吗? 我在生产环境中遇到了一个问题,上游请求ES集群(版本5.4)突然出现零星的长尾超时,访问ip也没有明显的集中,当时怀疑是有某个节点处理较慢导致的,但是通过ES日志统计RemoteTransport也没有发现异常的节点,切流到其他机房(集群配置相同)访问是正常的,所以比较困惑,希望老师指点下,感谢~������
2020-09-05
EidLeung
内存硬盘比例1:50,数据量控制在2T,JVM内存不要超过32G。这些对不上啊?
2020-07-08
2
收起评论