当前播放: 19 | 显式Mapping设置与常见参数介绍







00:00 / 00:00

高清

高清

1.0x

2.0x
1.5x
1.25x
1.0x
0.5x



网页全屏



全屏

00:00

付费课程，可试看

课程目录

第一章：概述 (4讲)



01 | 课程介绍

免费

02 | 内容综述及学习建议

免费

03 | Elasticsearch简介及其发展历史

免费

04 | Elastic Stack家族成员及其应用场景

免费

第二章：安装上手 (4讲)



05 | Elasticsearch的安装与简单配置

免费

06 | Kibana的安装与界面快速浏览

07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro

08 | Logstash安装与导入数据

第三章：Elasticsearch入门 (15讲)



09 | 基本概念：索引、文档和REST API

10 | 基本概念：节点、集群、分片及副本

11 | 文档的基本CRUD与批量操作

12 | 倒排索引介绍

13 | 通过Analyzer进行分词

14 | Search API概览

15 | URI Search详解

16 | Request Body与Query DSL简介

17 | Query String&Simple Query String查询

18 | Dynamic Mapping和常见字段类型

19 | 显式Mapping设置与常见参数介绍

20 | 多字段特性及Mapping中配置自定义Analyzer

21 | Index Template和Dynamic Template

22 | Elasticsearch聚合分析简介

23 | 第一部分总结

第四章：深入搜索 (13讲)



24 | 基于词项和基于全文的搜索

25 | 结构化搜索

26 | 搜索的相关性算分

27 | Query&Filtering与多字符串多字段查询

28 | 单字符串多字段查询：Dis Max Query

29 | 单字符串多字段查询：Multi Match

30 | 多语言及中文分词与检索

31 | Space Jam，一次全文搜索的实例

32 | 使用Search Template和Index Alias查询

33 | 综合排序：Function Score Query优化算分

34 | Term&Phrase Suggester

35 | 自动补全与基于上下文的提示

36 | 配置跨集群搜索

第五章：分布式特性及分布式搜索的机制 (8讲)



37 | 集群分布式模型及选主与脑裂问题

38 | 分片与集群的故障转移

39 | 文档分布式存储

40 | 分片及其生命周期

41 | 剖析分布式查询及相关性算分

42 | 排序及Doc Values&Fielddata

43 | 分页与遍历：From, Size, Search After & Scroll API

44 | 处理并发读写操作

第六章：深入聚合分析 (4讲)



45 | Bucket & Metric聚合分析及嵌套聚合

46 | Pipeline聚合分析

47 | 作用范围与排序

48 | 聚合分析的原理及精准度问题

第七章：数据建模 (7讲)



49 | 对象及Nested对象

50 | 文档的父子关系

51 | Update By Query & Reindex API

52 | Ingest Pipeline & Painless Script

53 | Elasticsearch数据建模实例

54 | Elasticsearch数据建模最佳实践

55 | 第二部分总结回顾

第八章：保护你的数据 (3讲)



56 | 集群身份认证与用户鉴权

57 | 集群内部安全通信

58 | 集群与外部间的安全通信

第九章：水平扩展Elasticsearch集群 (6讲)



59 | 常见的集群部署方式

60 | Hot & Warm架构与Shard Filtering

61 | 分片设计及管理

62 | 如何对集群进行容量规划

63 | 在私有云上管理Elasticsearch集群的一些方法

64 | 在公有云上管理与部署Elasticsearch集群

第十章：生产环境中的集群运维 (10讲)



65 | 生产环境常用配置与上线清单

66 | 监控Elasticsearch集群

67 | 诊断集群的潜在问题

68 | 解决集群Yellow与Red的问题

69 | 提升集群写性能

70 | 提升进群读性能

71 | 集群压力测试

72 | 段合并优化及注意事项

73 | 缓存及使用Breaker限制内存使用

74 | 一些运维的相关建议

第十一章：索引生命周期管理 (2讲)



75 | 使用Shrink与Rollover API有效管理时间序列索引

76 | 索引全生命周期管理及工具介绍

第十二章：用Logstash和Beats构建数据管道 (3讲)



77 | Logstash入门及架构介绍

78 | 利用JDBC插件导入数据到Elasticsearch

79 | Beats介绍

第十三章：用Kibana进行数据可视化分析 (4讲)



80 | 使用Index Pattern配置数据

81 | 使用Kibana Discover探索数据

82 | 基本可视化组件介绍

83 | 构建Dashboard

第十四章：探索X-Pack套件 (6讲)



84 | 用Monitoring和Alerting监控Elasticsearch集群

85 | 用APM进行程序性能监控

86 | 用机器学习实现时序数据的异常检测（上）

87 | 用机器学习实现时序数据的异常检测（下）

88 | 用ELK进行日志管理

89 | 用Canvas做数据演示

实战1：电影搜索服务 (3讲)



90 | 项目需求分析及架构设计

91 | 将电影数据导入Elasticsearch

92 | 搭建你的电影搜索服务

实战2：Stackoverflow用户调查问卷分析 (3讲)



93 | 需求分析及架构设计

94 | 数据Extract & Enrichment

95 | 构建Insights Dashboard

备战：Elastic认证 (5讲)



96 | Elastic认证介绍

97 | 考点梳理

98 | 集群数据备份

99 | 基于Java和Elasticseach构建应用

100 | 结束语

19 | 显式Mapping设置与常见参数介绍

阮一鸣

eBay Pronto平台技术负责人

100讲约1000分钟16791

单独订阅¥129

2人成团¥89







本节摘要

课程 Demo

补充阅读

Mapping Parameters https://www.elastic.co/guide/en/elasticsearch/reference/7.1/mapping-params.html

课件地址

初识 Elasticsearch

展开



登录后留言

精选留言(18)

黄文韬

老师，请问一下text下的keyword作用是？

作者回复: 1. term查询的精确匹配
2. terms的aggregation

后续会有讲解

2019-07-07

 1

 5
SuperSnow

阮老师，您好！问两个问题。
1、在此节课中，定义一个字段可以定义成“keyword"，当时在讲数据类型时，对象或基本类型也并没有包括这个keyword，如果将keyword做为一种数据类型，可以将其理解成text类型的别名版了？
2、另外这里的keyword与text类型的子字段的keyword在作用上是有区别还是没有区别？

作者回复: 不好意思，让我来对这个做一下解释。应该包含两个概念。
1.text类型和keyword类型
2. 多字段定义

一切文本类型的字符串可以定义成 “text”或“keyword”两种类型。区别在于，text类型会使用默认分词器分词，当然你也可以为他指定特定的分词器。如果定义成keyword类型，那么默认就不会对其进行分词。

es对字符串类型的mappong设定，会将其定义成text，同时为他定义一个叫做keyword的子字段。keyword只是他的名字，你也可以定义成kw。这个字段的类型是keyword（这是一个类型的关键字）

多字段类型情况下，你可以查询 title，也可以查询title.keyword查询类型为keyword的子字段

2019-07-16



 4
SuperSnow

嗯，谢谢阮老师，大部分明白了，不过最后那句：多字段类型情况下，你可以查询 title，也可以查询title.keyword查询类型为keyword的子字段。
如果我对一个text类型的字段进行搜索"中国”，这个字段存的数据是“中国是一个好地方，有许多的美食，在中国还可以到处玩儿”。那我既可以查title="中国“，也可以用title.keyword="中国"（这个字段默认有一个子字段keyword)，应该都能搜出相同的文档结果。那为什么还需要加个keyword呢？是因为下面的两个原因？
1. term查询的精确匹配
2. terms的aggregation
那既然title和keyword都可以搜索一样的结果，都是根据倒排索引进行的执行，那title为什么不能起到上述两个作用？从本质上来说（都是根据倒排查询），两者不应该是一样的执行原理，那为啥还要多此一举呢？

作者回复: 需要分词还是精确匹配是需要结合业务考虑的。

使用分词，你查到的结果肯能多，但是会有一些无用信息。也就是所谓的增加recall

精确匹配，precision比较高，但是也会导致一些相关内容无法被匹配

2019-07-16



 2
zhupc

每一节的信息量都好大，得多看几遍

作者回复: 极客时间编辑的本意是，每个课程尽量不要太长。对知识点做了拆分，希望每个知识点一个视频。方便可以随便选一个看。看不懂可以再看一遍，或者过一段时间再看一次，也许就完全看懂了，或者发现了自己当初遗漏的知识点

2019-07-26



 1
Per

最后的例子, 为什么interests设置的值是数组, 和mapping定义不一致可以成功, 而且查看mapping的定义也没有变化.
能解释一下么

2019-12-18




碗里的小屁孩

请教一下mapping文件在定义之后可以修改吗？

作者回复: 有些参数可以设定，例如replica数量。增加新的字段

有些不能修改，例如shard数和一些有数据的字段的类型

2019-11-19




沱沱鱼

老师，请问下，关于null_value的设置
下面这个第二个测试数据，并没有放mobie,不会进行默认判断为null的操作吗？我试了下，也无法被检索出来.是否可以认为在elastic中，要想检索值为null的field,那么在插入数据的时候也需要相应的插入空置的这个field.

测试数据
PUT users/_doc/2
{
"firstName":"Ruan2",
"lastName": "Yiming2"
}

2019-10-31




张飞洪

阮老师，请问ES可不可以配置自增长字段，每次查询可以自动给列表排序号，类似数据库的自增长字段一样，每次查询都可以根据某个字段排序后进行自动排序号？

2019-10-12




wj

老师，请问copy_to的字段(例如：fullname）如何指定分词器

2019-09-25




godtrue

1：text和keyword解释
1-1.text类型和keyword类型
1-2. 多字段定义
一切文本类型的字符串可以定义成 “text”或“keyword”两种类型。区别在于，text类型会使用默认分词器分词，当然你也可以为他指定特定的分词器。如果定义成keyword类型，那么默认就不会对其进行分词。
es对字符串类型的mappong设定，会将其定义成text，同时为他定义一个叫做keyword的子字段。keyword只是他的名字，你也可以定义成kw。这个字段的类型是keyword（这是一个类型的关键字）
多字段类型情况下，你可以查询 title，也可以查询title.keyword查询类型为keyword的子字段。
这节可以反复看，具有非常棒的指导意义。
有个疑问：
copy_to中的内容存储在哪里啦?没有在source中，她必定需要关联上source中对应的字段吧?怎么关联的，也需要加入到倒排索引中吧?

2019-09-19




柒

[2019-08-31T06:05:17,844][INFO ][org.logstash.beats.BeatsHandler] [local: 10.121.1.31:5044, remote: 10.121.0.69:4974] Handling exception: org.logstash.beats.BeatsParser$InvalidFrameProtocolException: Invalid Frame Type, received: 69

老师这种报Invalid Frame Type, received: 84 或者69的错误是什么原因呢会造成什么影响

2019-08-31




星亦辰

为什么我传递数据的unix 时间戳，不被识别为date类型，相反的而被识别为long 类型，如何传递一个可以被识别的时间戳类型呢？索引，总是在自动创建，每次都mapping 不太现实。

作者回复: 你可以看一下index template，这样不需要每次被mapping。

dynamic mapping其实在生产环境需要慎用，最好还是要自己写mapping文件，或者用index template

2019-08-21




ᴇɴ

老师好，The index pattern logstash-* does not contain any of the following compatible field types: geo_point 请问怎么操作

2019-08-09




李亚林

老师，倒排索引中的offset是用于高亮的我可以理解，但是这个position有啥用啊。
POST _analyze
{
  "analyzer": "ik_max_word",
  "text": ["公安部：各地校车将享最高路权"]
}

# 结果
{
  "tokens": [
    {
      "token": "公安部",
      "start_offset": 0,
      "end_offset": 3,
      "type": "CN_WORD",
      "position": 0
    },
    {
      "token": "公安",
      "start_offset": 0,
      "end_offset": 2,
      "type": "CN_WORD",
      "position": 1
    },
    {
      "token": "部",
      "start_offset": 2,
      "end_offset": 3,
      "type": "CN_CHAR",
      "position": 2
    },
    {
      "token": "各地",
      "start_offset": 4,
      "end_offset": 6,
      "type": "CN_WORD",
      "position": 3
    },
    {
      "token": "校车",
      "start_offset": 6,
      "end_offset": 8,
      "type": "CN_WORD",
      "position": 4
    },
    {
      "token": "将",
      "start_offset": 8,
      "end_offset": 9,
      "type": "CN_CHAR",
      "position": 5
    },
    {
      "token": "享",
      "start_offset": 9,
      "end_offset": 10,
      "type": "CN_CHAR",
      "position": 6
    },
    {
      "token": "最高",
      "start_offset": 10,
      "end_offset": 12,
      "type": "CN_WORD",
      "position": 7
    },
    {
      "token": "路",
      "start_offset": 12,
      "end_offset": 13,
      "type": "CN_CHAR",
      "position": 8
    },
    {
      "token": "权",
      "start_offset": 13,
      "end_offset": 14,
      "type": "CN_CHAR",
      "position": 9
    }
  ]
}

作者回复: 这个只是你分词后，所在数组里的一个位置信息吧

2019-08-03




易冥天

老师，提一个问题。

在 Index Options 中，四种级别的介绍下面，offsets 你那儿好像有一个写的是 offects。

作者回复: 谢谢提醒，应该是写错了

2019-07-12




小武

讲到新名词的时候还请解释一下，它是什么意思，在哪里会发挥什么作用。不然一个地方不懂，讲完之后变成一片不懂，懂的地方不能串联，根本不能形成记忆。

作者回复: 能否说一下具体是什么名词不懂？课程总共有90节，每节10分钟。不可能每节课上每个名词都解释的一清二楚。我建议可以先读一下学习路径，从广度上有一个大概的了解。然后再来听每一节课，碰到很细节的东西，需要自己啃API。

2019-07-11




WL

请问一下老师，四种级别的Index Options的设置能不能再详细讲下。docs是不是表示在每个倒排索引项中都记录文档id；frequs是不是表示每个倒排索引项记录文档Id和该索引出现的次数；position是不是记录文档id，次数，还有该索引项出现的位置，那这个位置是怎么标记呢，是从文档开始的字节数吗；offset 的character offset是啥意思，我看官网说是 character offsets（ which map the term back to the original string）我没理解这句话是啥意思。

2019-07-10

 1


danvid

老师，mappinh信息是存在哪里的，是lucene上吗，如果是的话明天我用luke看能不能找到

作者回复: 可以用get index/_mapping 查看mapping信息

2019-07-10

 1

