作者回复: date类型是包含时区信息的，如果我们没有在json代表日期的字符串中显式指定时区，对es来说没什么问题，但是如果通过kibana显示es里的数据时，就会出现问题，数据的时间会晚8个小时。因为kibana从es里读取的date类型数据，没有时区信息， kibana会默认当作0时区来解析，但是kibana在通过浏览器展示的时候，会通过js获取当前客户端机器所在的时区，也就是东八区，所以kibana会把从es得到的日期数据减去8小时。这里就会导致kibana经常遇到的“数据时间延迟8小时”的问题。所以最佳实践方案就是：我们在往es提交日期数据的时候，直接提交带有时区信息的日期字符串，如：“2016-07-15T12:58:17.136+0800”。 ##索引中定义的日期格式与提交数据的日期格式要一致，否则会报错。

2019-07-14

2

16

啊瀚

老师有一个问题，term查询是不分词的，哪怕我们设置了该字段的搜索分词也不分吗？ match是分词的，哪怕我们没有设置搜索分词也会分吗？

作者回复: 如果字段设置了keyword，你用term查询，就会精确匹配。例如说keyword字段，索引时是“Iphone”，你的term查询必须是Iphone，输入“iphone”就无法匹配。而如果你的字段是“text”类型。你index时候，如果是“Iphone”，在term查询时，“iphone”可以匹配。但是，“Iphone”不会。很多刚接触的同学会有点困惑。背后的原因是，text类型的数据会分词，默认分词器会将输入一个个单词切开，并且转小写了。所以你 term查询时，必须用“iphone” 如果你是match查询，在text字段上查询iphone或者Iphone 应该都能查到。课上提供的例子你可以运行测试一下。

2019-07-12

3

8

sdsdkdsj

老师第二部分的pdf麻烦上传下

作者回复: 好的，我让编辑帮我生成后，我github上传。下周一周二吧

2019-07-13

4

6

cricket1981

最后一个课堂问题：对多值字段进行精确匹配提到要用到genre_count组合bool query实现，老师能给个参考实现吗？

作者回复: 看一下这个，建模时，加入了tags_count的字段，然后通过bool 查询中，加入一个filter，过滤tags个数 PUT my_movies/_doc/1 { "title":"movie title action", "tags":["action"], "tags_count":1 } PUT my_movies/_doc/2 { "title":"movie title love", "tags":["action","love"], "tags_count":2 } POST my_movies/_search { "query": { "bool": { "must": [ {"match": { "tags": "action" }} ], "filter": { "term": { "tags_count": 1 } } } } }

2019-07-14



3

无笔秀才

老师，文档上也看到了filter 忽略了算分的步骤，而且可以缓存。那么我们目前用不到分值是不是可以把条件都写在filter里呢？缓存压力会不会过大，会不会类似oversharding的效果？或者说有哪些负面影响？

作者回复: overshard的意思是，分片数设置过多。能用filter context就尽量不要用query content，应该不存在什么负面影响

2019-07-13



3

小鱼

GET products/_mapping 查看索引的信息，没有看到分词器相关信息，是不是默认在text类型上应用standard的分词器？其他的数据类型boolean,date,long不会分词？ { "products" : { "mappings" : { "_doc" : { "properties" : { "avaliable" : { "type" : "boolean" }, "date" : { "type" : "date" }, "price" : { "type" : "long" }, "productID" : { "type" : "text", "fields" : { "keyword" : { "type" : "keyword", "ignore_above" : 256 } } } } } } } }

作者回复: 理解正确。如果你在mapping中指定了其他的分词器，例如“english”，get时就能看到了

2019-07-14



2

老师好，昨天提了一个问题，今天看了一下执行计划，通过uri方式的get请求，默认都会把text类型的字段进行拆分再转化为小写后，才进行termQuery查询；而RequertBody才是真正意义上的term查询（不会进行处理），很好奇这两种查询方式为什么会有这种差异呢？是否有什么缘由？求解答！

作者回复: dsl里面有term query和match query 两种。term query不分词，match query分词。正事情况下，用rrquest body query结合dsl才是最常见的写法

2019-08-07



1

我是爹

mininum_should_match 这个参数是什么意思，有个 term 和 match 的查询都能使用这个参数吗

作者回复: https://blog.csdn.net/xiao_jun_0820/article/details/51095521

2019-09-16

2



东方奇骥

老师，请教一下计算出的分数score的意义是什么？

作者回复: 越高，说明相关度越高。es默认对搜索结果的算分降序排序

2019-07-29





紫丁香珠

老师，"value": "iPhone" 这个值是es里实际存储的值，为什么查不到呢？//"value":"iphone" 小写的却可以查询到，谢谢～ POST /products/_search { "query": { "term": { "desc": { "value": "iPhone" //"value":"iphone" } } } }

作者回复: 因为desc被分词了（默认分词器还会转小写）。如果要做精确匹配，需要要看keyword类型的字段。

2019-07-18





收起评论