当前播放: 19 | 显式Mapping设置与常见参数介绍
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
课程目录
第一章:概述 (4讲)
01 | 课程介绍
免费
02 | 内容综述及学习建议
免费
03 | Elasticsearch简介及其发展历史
免费
04 | Elastic Stack家族成员及其应用场景
免费
第二章:安装上手 (4讲)
05 | Elasticsearch的安装与简单配置
免费
06 | Kibana的安装与界面快速浏览
07 | 在Docker容器中运行Elasticsearch Kibana和Cerebro
08 | Logstash安装与导入数据
第三章:Elasticsearch入门 (15讲)
09 | 基本概念:索引、文档和REST API
10 | 基本概念:节点、集群、分片及副本
11 | 文档的基本CRUD与批量操作
12 | 倒排索引介绍
13 | 通过Analyzer进行分词
14 | Search API概览
15 | URI Search详解
16 | Request Body与Query DSL简介
17 | Query String&Simple Query String查询
18 | Dynamic Mapping和常见字段类型
19 | 显式Mapping设置与常见参数介绍
20 | 多字段特性及Mapping中配置自定义Analyzer
21 | Index Template和Dynamic Template
22 | Elasticsearch聚合分析简介
23 | 第一部分总结
第四章:深入搜索 (13讲)
24 | 基于词项和基于全文的搜索
25 | 结构化搜索
26 | 搜索的相关性算分
27 | Query&Filtering与多字符串多字段查询
28 | 单字符串多字段查询:Dis Max Query
29 | 单字符串多字段查询:Multi Match
30 | 多语言及中文分词与检索
31 | Space Jam,一次全文搜索的实例
32 | 使用Search Template和Index Alias查询
33 | 综合排序:Function Score Query优化算分
34 | Term&Phrase Suggester
35 | 自动补全与基于上下文的提示
36 | 配置跨集群搜索
第五章:分布式特性及分布式搜索的机制 (8讲)
37 | 集群分布式模型及选主与脑裂问题
38 | 分片与集群的故障转移
39 | 文档分布式存储
40 | 分片及其生命周期
41 | 剖析分布式查询及相关性算分
42 | 排序及Doc Values&Fielddata
43 | 分页与遍历:From, Size, Search After & Scroll API
44 | 处理并发读写操作
第六章:深入聚合分析 (4讲)
45 | Bucket & Metric聚合分析及嵌套聚合
46 | Pipeline聚合分析
47 | 作用范围与排序
48 | 聚合分析的原理及精准度问题
第七章:数据建模 (7讲)
49 | 对象及Nested对象
50 | 文档的父子关系
51 | Update By Query & Reindex API
52 | Ingest Pipeline & Painless Script
53 | Elasticsearch数据建模实例
54 | Elasticsearch数据建模最佳实践
55 | 第二部分总结回顾
第八章:保护你的数据 (3讲)
56 | 集群身份认证与用户鉴权
57 | 集群内部安全通信
58 | 集群与外部间的安全通信
第九章:水平扩展Elasticsearch集群 (6讲)
59 | 常见的集群部署方式
60 | Hot & Warm架构与Shard Filtering
61 | 分片设计及管理
62 | 如何对集群进行容量规划
63 | 在私有云上管理Elasticsearch集群的一些方法
64 | 在公有云上管理与部署Elasticsearch集群
第十章:生产环境中的集群运维 (10讲)
65 | 生产环境常用配置与上线清单
66 | 监控Elasticsearch集群
67 | 诊断集群的潜在问题
68 | 解决集群Yellow与Red的问题
69 | 提升集群写性能
70 | 提升进群读性能
71 | 集群压力测试
72 | 段合并优化及注意事项
73 | 缓存及使用Breaker限制内存使用
74 | 一些运维的相关建议
第十一章:索引生命周期管理 (2讲)
75 | 使用Shrink与Rollover API有效管理时间序列索引
76 | 索引全生命周期管理及工具介绍
第十二章:用Logstash和Beats构建数据管道 (3讲)
77 | Logstash入门及架构介绍
78 | 利用JDBC插件导入数据到Elasticsearch
79 | Beats介绍
第十三章:用Kibana进行数据可视化分析 (4讲)
80 | 使用Index Pattern配置数据
81 | 使用Kibana Discover探索数据
82 | 基本可视化组件介绍
83 | 构建Dashboard
第十四章:探索X-Pack套件 (6讲)
84 | 用Monitoring和Alerting监控Elasticsearch集群
85 | 用APM进行程序性能监控
86 | 用机器学习实现时序数据的异常检测(上)
87 | 用机器学习实现时序数据的异常检测(下)
88 | 用ELK进行日志管理
89 | 用Canvas做数据演示
实战1:电影搜索服务 (3讲)
90 | 项目需求分析及架构设计
91 | 将电影数据导入Elasticsearch
92 | 搭建你的电影搜索服务
实战2:Stackoverflow用户调查问卷分析 (3讲)
93 | 需求分析及架构设计
94 | 数据Extract & Enrichment
95 | 构建Insights Dashboard
备战:Elastic认证 (5讲)
96 | Elastic认证介绍
97 | 考点梳理
98 | 集群数据备份
99 | 基于Java和Elasticseach构建应用
100 | 结束语
19 | 显式Mapping设置与常见参数介绍

19 | 显式Mapping设置与常见参数介绍

阮一鸣
eBay Pronto平台技术负责人
100讲 约1000分钟16791
单独订阅¥129
2人成团¥89
9
登录 后留言

精选留言(18)

  • 黄文韬
    老师,请问一下text下的keyword作用是?

    作者回复: 1. term查询的精确匹配
    2. terms的aggregation

    后续会有讲解

    2019-07-07
    1
    5
  • SuperSnow
    阮老师,您好!问两个问题。
    1、在此节课中,定义一个字段可以定义成“keyword",当时在讲数据类型时,对象或基本类型也并没有包括这个keyword,如果将keyword做为一种数据类型,可以将其理解成text类型的别名版了?
    2、另外这里的keyword与text类型的子字段的keyword在作用上是有区别还是没有区别?

    作者回复: 不好意思,让我来对这个做一下解释。应该包含两个概念。
    1.text类型和keyword类型
    2. 多字段定义

    一切文本类型的字符串可以定义成 “text”或“keyword”两种类型。区别在于,text类型会使用默认分词器分词,当然你也可以为他指定特定的分词器。如果定义成keyword类型,那么默认就不会对其进行分词。

    es对字符串类型的mappong设定,会将其定义成text,同时为他定义一个叫做keyword的子字段。keyword只是他的名字,你也可以定义成kw。这个字段的类型是keyword(这是一个类型的关键字)

    多字段类型情况下,你可以查询 title,也可以查询title.keyword查询类型为keyword的子字段

    2019-07-16
    4
  • SuperSnow
    嗯,谢谢阮老师,大部分明白了,不过最后那句:多字段类型情况下,你可以查询 title,也可以查询title.keyword查询类型为keyword的子字段。
    如果我对一个text类型的字段进行搜索"中国”,这个字段存的数据是“中国是一个好地方,有许多的美食,在中国还可以到处玩儿”。那我既可以查title="中国“,也可以用title.keyword="中国"(这个字段默认有一个子字段keyword),应该都能搜出相同的文档结果。那为什么还需要加个keyword呢?是因为下面的两个原因?
    1. term查询的精确匹配
    2. terms的aggregation
    那既然title和keyword都可以搜索一样的结果,都是根据倒排索引进行的执行,那title为什么不能起到上述两个作用?从本质上来说(都是根据倒排查询),两者不应该是一样的执行原理,那为啥还要多此一举呢?

    作者回复: 需要分词还是精确匹配是需要结合业务考虑的。

    使用分词,你查到的结果肯能多,但是会有一些无用信息。也就是所谓的增加recall

    精确匹配,precision比较高,但是也会导致一些相关内容无法被匹配

    2019-07-16
    2
  • zhupc
    每一节的信息量都好大,得多看几遍

    作者回复: 极客时间编辑的本意是,每个课程尽量不要太长。对知识点做了拆分,希望每个知识点一个视频。方便可以随便选一个看。看不懂可以再看一遍,或者过一段时间再看一次,也许就完全看懂了,或者发现了自己当初遗漏的知识点

    2019-07-26
    1
  • Per
    最后的例子, 为什么interests设置的值是数组, 和mapping定义不一致可以成功, 而且查看mapping的定义也没有变化.
    能解释一下么
    2019-12-18
  • 碗里的小屁孩
    请教一下mapping文件在定义之后可以修改吗?

    作者回复: 有些参数可以设定,例如replica数量。增加新的字段

    有些不能修改,例如shard数和一些有数据的字段的类型

    2019-11-19
  • 沱沱鱼
    老师,请问下,关于null_value的设置
    下面这个第二个测试数据,并没有放mobie,不会进行默认判断为null的操作吗?我试了下,也无法被检索出来.是否可以认为在elastic中,要想检索值为null的field,那么在插入数据的时候也需要相应的插入空置的这个field.

    测试数据
    PUT users/_doc/2
    {
      "firstName":"Ruan2",
      "lastName": "Yiming2"
    }
    2019-10-31
  • 张飞洪
    阮老师,请问ES可不可以配置自增长字段,每次查询可以自动给列表排序号,类似数据库的自增长字段一样,每次查询都可以根据某个字段排序后进行自动排序号?
    2019-10-12
  • wj
    老师,请问copy_to的字段(例如:fullname)如何指定分词器
    2019-09-25
  • godtrue
    1:text和keyword解释
    1-1.text类型和keyword类型
    1-2. 多字段定义
    一切文本类型的字符串可以定义成 “text”或“keyword”两种类型。区别在于,text类型会使用默认分词器分词,当然你也可以为他指定特定的分词器。如果定义成keyword类型,那么默认就不会对其进行分词。
    es对字符串类型的mappong设定,会将其定义成text,同时为他定义一个叫做keyword的子字段。keyword只是他的名字,你也可以定义成kw。这个字段的类型是keyword(这是一个类型的关键字)
    多字段类型情况下,你可以查询 title,也可以查询title.keyword查询类型为keyword的子字段。
    这节可以反复看,具有非常棒的指导意义。
    有个疑问:
    copy_to中的内容存储在哪里啦?没有在source中,她必定需要关联上source中对应的字段吧?怎么关联的,也需要加入到倒排索引中吧?
    2019-09-19
  • [2019-08-31T06:05:17,844][INFO ][org.logstash.beats.BeatsHandler] [local: 10.121.1.31:5044, remote: 10.121.0.69:4974] Handling exception: org.logstash.beats.BeatsParser$InvalidFrameProtocolException: Invalid Frame Type, received: 69

    老师这种报Invalid Frame Type, received: 84 或者69的错误是什么原因呢 会造成什么影响
    2019-08-31
  • 星亦辰
    为什么我传递数据的unix 时间戳, 不被识别为date类型,相反的而被识别为long 类型,如何传递一个可以被识别的 时间戳类型呢? 索引,总是在自动创建,每次都mapping 不太现实。

    作者回复: 你可以看一下index template,这样不需要每次被mapping。

    dynamic mapping其实在生产环境需要慎用,最好还是要自己写mapping文件,或者用index template

    2019-08-21
  • ᴇɴ
    老师好,The index pattern logstash-* does not contain any of the following compatible field types: geo_point 请问怎么操作
    2019-08-09
  • 李亚林
    老师,倒排索引中的offset是用于高亮的我可以理解,但是这个position有啥用啊。
    POST _analyze
    {
      "analyzer": "ik_max_word",
      "text": ["公安部:各地校车将享最高路权"]
    }

    # 结果
    {
      "tokens": [
        {
          "token": "公安部",
          "start_offset": 0,
          "end_offset": 3,
          "type": "CN_WORD",
          "position": 0
        },
        {
          "token": "公安",
          "start_offset": 0,
          "end_offset": 2,
          "type": "CN_WORD",
          "position": 1
        },
        {
          "token": "部",
          "start_offset": 2,
          "end_offset": 3,
          "type": "CN_CHAR",
          "position": 2
        },
        {
          "token": "各地",
          "start_offset": 4,
          "end_offset": 6,
          "type": "CN_WORD",
          "position": 3
        },
        {
          "token": "校车",
          "start_offset": 6,
          "end_offset": 8,
          "type": "CN_WORD",
          "position": 4
        },
        {
          "token": "将",
          "start_offset": 8,
          "end_offset": 9,
          "type": "CN_CHAR",
          "position": 5
        },
        {
          "token": "享",
          "start_offset": 9,
          "end_offset": 10,
          "type": "CN_CHAR",
          "position": 6
        },
        {
          "token": "最高",
          "start_offset": 10,
          "end_offset": 12,
          "type": "CN_WORD",
          "position": 7
        },
        {
          "token": "路",
          "start_offset": 12,
          "end_offset": 13,
          "type": "CN_CHAR",
          "position": 8
        },
        {
          "token": "权",
          "start_offset": 13,
          "end_offset": 14,
          "type": "CN_CHAR",
          "position": 9
        }
      ]
    }

    作者回复: 这个只是你分词后,所在数组里的一个位置信息吧

    2019-08-03
  • 易冥天
    老师,提一个问题。

    在 Index Options 中,四种级别的介绍下面,offsets 你那儿好像有一个写的是 offects。

    作者回复: 谢谢提醒,应该是写错了

    2019-07-12
  • 小武
    讲到新名词的时候还请解释一下,它是什么意思,在哪里会发挥什么作用。不然一个地方不懂,讲完之后变成一片不懂,懂的地方不能串联,根本不能形成记忆。

    作者回复: 能否说一下具体是什么名词不懂?课程总共有90节,每节10分钟。不可能每节课上每个名词都解释的一清二楚。我建议可以先读一下学习路径,从广度上有一个大概的了解。然后再来听每一节课,碰到很细节的东西,需要自己啃API。

    2019-07-11
  • WL
    请问一下老师,四种级别的Index Options的设置能不能再详细讲下。docs是不是表示在每个倒排索引项中都记录文档id;frequs是不是表示每个倒排索引项记录文档Id和该索引出现的次数;position是不是记录文档id,次数,还有该索引项出现的位置,那这个位置是怎么标记呢,是从文档开始的字节数吗;offset 的character offset是啥意思,我看官网说是 character offsets( which map the term back to the original string)我没理解这句话是啥意思。
    2019-07-10
    1
  • danvid
    老师,mappinh信息是存在哪里的,是lucene上吗,如果是的话明天我用luke看能不能找到

    作者回复: 可以用get index/_mapping 查看mapping信息

    2019-07-10
    1
收起评论
看过的人还看
从0开始学架构

李运华  资深技术专家

59讲 | 39138 人已学习

拼团 ¥69 原价 ¥99
趣谈网络协议

刘超  网易研究院云计算技术部首席架构师

51讲 | 39834 人已学习

拼团 ¥69 原价 ¥99
MySQL实战45讲

林晓斌  网名丁奇,前阿里资深技术专家

48讲 | 43715 人已学习

拼团 ¥69 原价 ¥99
Kafka核心技术与实战

胡夕  人人贷计算平台部总监,Apache Kafka Contributor

46讲 | 8517 人已学习

拼团 ¥79 原价 ¥99