下载APP
登录
关闭
讲堂
算法训练营
Python 进阶训练营
企业服务
极客商城
客户端下载
兑换中心
渠道合作
推荐作者
当前播放: 29 | 单字符串多字段查询:Multi Match
00:00 / 00:00
标清
  • 标清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看

Elasticsearch核心技术与实战

共100讲 · 约1000分钟
16624
免费
01 | 课程介绍
免费
02 | 内容综述及学习建议
免费
03 | Elasticsearch简介及其发...
免费
04 | Elastic Stack家族成员及...
免费
05 | Elasticsearch的安装与...
06 | Kibana的安装与界面快速...
07 | 在Docker容器中运行Elas...
08 | Logstash安装与导入数据
09 | 基本概念:索引、文档和...
10 | 基本概念:节点、集群、分...
11 | 文档的基本CRUD与批量操...
12 | 倒排索引介绍
13 | 通过Analyzer进行分词
14 | Search API概览
15 | URI Search详解
16 | Request Body与Query ...
17 | Query String&Simple ...
18 | Dynamic Mapping和常见...
19 | 显式Mapping设置与常见参...
20 | 多字段特性及Mapping中配...
21 | Index Template和Dynami...
22 | Elasticsearch聚合分析简...
23 | 第一部分总结
24 | 基于词项和基于全文的搜索
25 | 结构化搜索
26 | 搜索的相关性算分
27 | Query&Filtering与多字...
28 | 单字符串多字段查询:Dis...
29 | 单字符串多字段查询:Mult...
30 | 多语言及中文分词与检索
31 | Space Jam,一次全文搜索...
32 | 使用Search Template和In...
33 | 综合排序:Function Scor...
34 | Term&Phrase Suggester
35 | 自动补全与基于上下文的提...
36 | 配置跨集群搜索
37 | 集群分布式模型及选主与脑...
38 | 分片与集群的故障转移
39 | 文档分布式存储
40 | 分片及其生命周期
41 | 剖析分布式查询及相关性算...
42 | 排序及Doc Values&Field...
43 | 分页与遍历:From, Siz...
44 | 处理并发读写操作
45 | Bucket & Metric聚合分...
46 | Pipeline聚合分析
47 | 作用范围与排序
48 | 聚合分析的原理及精准度问...
49 | 对象及Nested对象
50 | 文档的父子关系
51 | Update By Query &...
52 | Ingest Pipeline & Pa...
53 | Elasticsearch数据建模实...
54 | Elasticsearch数据建模最...
55 | 第二部分总结回顾
56 | 集群身份认证与用户鉴权
57 | 集群内部安全通信
58 | 集群与外部间的安全通信
59 | 常见的集群部署方式
60 | Hot & Warm架构与Shard...
61 | 分片设计及管理
62 | 如何对集群进行容量规划
63 | 在私有云上管理Elasticsea...
64 | 在公有云上管理与部署Elas...
65 | 生产环境常用配置与上线清...
66 | 监控Elasticsearch集群
67 | 诊断集群的潜在问题
68 | 解决集群Yellow与Red的问...
69 | 提升集群写性能
70 | 提升进群读性能
71 | 集群压力测试
72 | 段合并优化及注意事项
73 | 缓存及使用Breaker限制内...
74 | 一些运维的相关建议
75 | 使用Shrink与Rollover AP...
76 | 索引全生命周期管理及工具...
77 | Logstash入门及架构介绍
78 | 利用JDBC插件导入数据到El...
79 | Beats介绍
80 | 使用Index Pattern配置数...
81 | 使用Kibana Discover探索...
82 | 基本可视化组件介绍
83 | 构建Dashboard
84 | 用Monitoring和Alerting监...
85 | 用APM进行程序性能监控
86 | 用机器学习实现时序数据的...
87 | 用机器学习实现时序数据的...
88 | 用ELK进行日志管理
89 | 用Canvas做数据演示
90 | 项目需求分析及架构设计
91 | 将电影数据导入Elasticsea...
92 | 搭建你的电影搜索服务
93 | 需求分析及架构设计
94 | 数据Extract & Enrichm...
95 | 构建Insights Dashboard
96 | Elastic认证介绍
97 | 考点梳理
98 | 集群数据备份
99 | 基于Java和Elasticseach构...
100 | 结束语
本节摘要
展开

精选留言(18)

  • 2019-09-12
    老师,想问下,改了一个索引的mapping,原索引的文档会被删除吗?

    作者回复: mapping中 字段只能被增加。你无法改变一个现有字段的类型。如果希望修改类型,需要使用reindex api

    如果你增加了新的子字段或者修改了分词器,你需要在mapping修改后,执行updateby query,是的分词器对老的文档也生效。

    至于你的问题,文档不会被删除的,只是有些修改不做update by query,就不会生效

    2
  • 2019-09-09
    老师,multi match query的best field和上一节的dis_max query都是取field分最高的,达到效果是一样的,我这么理解对吗

    作者回复: 理解正确

    2
  • 2019-11-09
    老师,几十节课学习下来,我发现写个稍微复杂的查询远比SQL复杂的多,代码量也大。
    有没有SQL的方式去查询呢?

    作者回复: 一些结构化的查询 是支持使用sql的方式的。但是sql支持的还很有限,例如不支持数组等

    1
  • 2019-09-20
    知识量确实大,听老师,先听一遍视频,然后照着例子再来一遍,不过我觉得并不需要记住所有内容,应用时知道怎么查询也很关键。大脑类似缓存,硬盘或网盘才是持久化大量数据的地方。

    作者回复: 🐂👍

    1
  • 2019-07-27
    老师,你好。

    我有一个名字为:testapplog 的index,里面有三个字段,分布是logtime/logtype/logmsg
    我在使用 multi_match 的cross_fields进行查询,如果输入一个三个一个字段的某个值都可以查询到结果,但如果我尝试查询两个不同字段的内容时,使用查询语句却没有结果,请问老师可能是哪里出了问题?

    查询1:logmsg字段中匹配 testmsg 信息, 能查询到结果
    POST testapplog/_search
    {
      "query": {
        "multi_match": {
          "query": "testmsg",
          "type": "cross_fields",
          "operator": "and",
          "fields": ["logtime", "logtype","logmsg"]
        }
      }
    }

    //查询2,logtype字段查询 debug 能查询到结果
    POST testapplog/_search
    {
      "query": {
        "multi_match": {
          "query": "debug",
          "type": "cross_fields",
          "operator": "and",
          "fields": ["logtime", "logtype","logmsg"]
        }
      }
    }

    //查询3,组合查询(index中存在 logtype = debug 同时 logmsg包含 testmsg的数据),但没有返回查询结果???
    POST testapplog/_search
    {
      "query": {
        "multi_match": {
          "query": "debug testmsg",
          "type": "cross_fields",
          "operator": "and",
          "fields": ["logtime", "logtype","logmsg"]
        }
      }
    }
    展开
    1
    1
  • 2019-07-25
    老师 有个问题想咨询一下 systemlog 当中查询 host.name 查询 比如“CMDB-22-16” 这台机器

    查询的结果显示 将这个查询字符串进行了拆分 看了您之前的视频 多次尝试无果 不清楚这种 dsl 查询

    语法 应该如何写 可以給一些提示吗 谢谢

    作者回复: 你应该将host.name的类型设置成keyword,然后用term查询,就会做精确匹配而不会先进行分词。

    如果你没有做mapping设置,es会默认设置一个keyword子字段,你对host.name.keyword子字段做term查询也可以的。

    这个知识点应该在第二部分第一个视频里有讲解

    1
    1
  • 老师你好!多个字段使用copy_to到同一个字段上,这个copyto字段内部是按照数组的方式存储多个内容的吗?有没有一个方法类似于copy_to,能将多个字段以某种排列方式,如将三个字段的值a、b、c以a-b-c的方式存储在copy_to的字段上?
    1
    1
  • 2019-12-10
    老师,我现在想term和multi_match能配合嘛?比如一个这样的需求。搜索的文档首先要满足term的条件,其余字段想用multi_match来影响打分,我尝试使用bool query包裹must,must里写一个term query一个multi_match,但是搜索不出我想要的结果。这是为什么呢,是不支持这样写嘛?有其他办法嘛?
  • 2019-12-07
    老师,copy to耗空间大吗,比如:有字段A copy to B,那空间是不是提升一倍
  • 2019-10-23
    copy to 是 and 得关系?
  • 问题:如是mapping,索引时按照standard和english分词,搜索时对字符串“barking dogs”按哪种方式分词?

    PUT /titles
    {
      "mappings": {
        "properties": {
          "title": {
            "type": "text",
            "analyzer": "english",
            "fields": {"std": {"type": "text","analyzer": "standard"}}
          }
        }
      }
    }

    GET /titles/_search
    {
       "query": {
            "multi_match": {
                "query": "barking dogs",
                "type": "most_fields",
                "fields": [ "title", "title.std" ]
            }
        }
    }
    展开
  • 2019-08-28
    "title^10" ? what means ^10 ? And it is executeable, and _score get higher.
  • 2019-08-01
    老师,你能不能照顾下我这种初学者,我还在理解best_field的时候,你很自然的引出了most field,一开始学,实在反应不过来(◎ロ◎)

    作者回复: 每节课的信息量其实都挺大的,建议可以一遍听不懂,课后按照github上的例子自己运行一遍,然后再听一次。

  • 2019-07-25
    老师你好,现在想对多个字段进行match查询,按照Edge-Ngram分词,其实有时候输入已经是完全匹配了,但是因为其他字段干扰导致排序靠后,如何控制这个相关性呢?是否能提供一些思路?
  • 2019-07-23
    咨询一个es重启机制问题,我是一个单台es,配置了4个数据目录,每个index分4个shard,总共16000个shard,当重启es时,所有的shard变成Unassigned状态,然后需要一个个进行分配,耗时时间非常长,1到2个小时,这个期间整个es不可用。我的疑问是,仅仅是重启了es,为啥所有shard的状态都变为未分配,这个分配信息重启之前应该是有的,为什么需要重建呢。

    作者回复: 你可以通过设置cluster settings中的

    disable_allocation为true,然后再做重启,然后再打开这个设置项

    1
  • 2019-07-23
    老师您好,三个master节点最多能管理多少节点,多少实例?当前我的集群总是报从节点ping主节点的时候 master left错误,可从哪方面排查呢

    作者回复: 对于第一个问题,主要还是看你单台master的配置。配置三台master其实只有一台是active master。三台是为了解决脑裂和HA的问题的。

    一般来说很多生产环境,几百台节点的情况下,也就配置了三台master节点

    2
  • 2019-07-22
    老师您好 在执行demo中创建 PUT /titles 这个示例时候,报错

    {
      "error": {
        "root_cause": [
          {
            "type": "mapper_parsing_exception",
            "reason": "Root mapping definition has unsupported parameters: [my_type : {properties={title={analyzer=english, type=string, fields={std={analyzer=standard, type=string}}}}}]"
          }
        ],
        "type": "mapper_parsing_exception",
        "reason": "Failed to parse mapping [_doc]: Root mapping definition has unsupported parameters: [my_type : {properties={title={analyzer=english, type=string, fields={std={analyzer=standard, type=string}}}}}]",
        "caused_by": {
          "type": "mapper_parsing_exception",
          "reason": "Root mapping definition has unsupported parameters: [my_type : {properties={title={analyzer=english, type=string, fields={std={analyzer=standard, type=string}}}}}]"
        }
      },
      "status": 400
    }
    展开

    作者回复: 400错误,提示的是你的payload格式有问题,请仔细检查,确保没有遗漏逗号之类的

    3
  • 2019-07-21
    老师您好,我想问一个关于聚合查询的问题。我们有一个需求是按照某个字段进行bucket分组聚合查询,很多时候得到的查询结果集非常大(会得到几十万个桶),这种情况应用应该怎么处理呢?网上搜了一下,貌似ES不支持聚合以后分页拉取结果。谢谢!

    作者回复: 1.通过query做filter
    2. aggs支持buckey aggs中指定size参数
    3.可以使用sort进行排序