作者回复: 不好意思,让我来对这个做一下解释。应该包含两个概念。 1.text类型和keyword类型 2. 多字段定义 一切文本类型的字符串可以定义成 “text”或“keyword”两种类型。区别在于,text类型会使用默认分词器分词,当然你也可以为他指定特定的分词器。如果定义成keyword类型,那么默认就不会对其进行分词。 es对字符串类型的mappong设定,会将其定义成text,同时为他定义一个叫做keyword的子字段。keyword只是他的名字,你也可以定义成kw。这个字段的类型是keyword(这是一个类型的关键字) 多字段类型情况下,你可以查询 title,也可以查询title.keyword查询类型为keyword的子字段
作者回复: 1. term查询的精确匹配 2. terms的aggregation 后续会有讲解
作者回复: 需要分词还是精确匹配是需要结合业务考虑的。 使用分词,你查到的结果肯能多,但是会有一些无用信息。也就是所谓的增加recall 精确匹配,precision比较高,但是也会导致一些相关内容无法被匹配
作者回复: 极客时间编辑的本意是,每个课程尽量不要太长。对知识点做了拆分,希望每个知识点一个视频。方便可以随便选一个看。看不懂可以再看一遍,或者过一段时间再看一次,也许就完全看懂了,或者发现了自己当初遗漏的知识点
作者回复: 能否说一下具体是什么名词不懂?课程总共有90节,每节10分钟。不可能每节课上每个名词都解释的一清二楚。我建议可以先读一下学习路径,从广度上有一个大概的了解。然后再来听每一节课,碰到很细节的东西,需要自己啃API。
作者回复: 数组不需要特殊定义。Mapping中也不支持定义数组的类型。如果写入的数据是String数组,那么类型就定义为String
作者回复: 嗯,谢谢你的建议。当初设计课程时,就是希望每一节课的时间长度控制在5到10分钟。在讲的时候有些点就没有做进一步的扩展。你可以留言大家一起讨论
作者回复: 有些参数可以设定,例如replica数量。增加新的字段 有些不能修改,例如shard数和一些有数据的字段的类型
作者回复: es自身应该没有自增的id
作者回复: 你可以看一下index template,这样不需要每次被mapping。 dynamic mapping其实在生产环境需要慎用,最好还是要自己写mapping文件,或者用index template