• yu
    2019-08-19
    老师,我觉得doc_count_error_upper_bound=4+2不是4+3???
     4
     5
  • eureka
    2019-09-24
    老师,右边的为什么遗漏数是3?最大可能数,不应该是2吗?
    
     3
  • godtrue
    2019-09-21
    本节好玩,刷新了认知
    1:size和shard_size的区别?
    size是最终返回多少个buckt的数量。
    shard_size是每个bucket在一个shard上取回的bucket的总数。然后,每个shard上的结果,会在coordinate节点上在做一次汇总,返回总数。
    2:doc_count_error_upper_bound:被遗漏的term分桶里面包含的文档有可能的最大值——千万注意“可能的最大值”!
    文中的例子 4+3没毛病,因为取回的三个的最小的桶里面是4个。所以遗漏的最大的可能数值是4。注意是“可能最大”而不是“实际最大值”。
    3:关于coordinate的注意事项?
    任何节点都具备coordinate的能力,也就是说你无法配置一个节点,不具备coordinate的角色。但是你可以配置只负责coordinate的节点。数据存储,都保存在数据节点上。——一个节点如果是数据节点,则必然具备存储数据的能力,而ES中任何节点都天生具备路由的能力。
    展开
    
     3
  • 氧气🌙 🐟 🌺
    2019-08-20
    doc_count_error_upper_bound:被遗漏的term分桶里面包含的文档有可能的最大值
    左边分片返回分桶ABC,剩下的有可能遗漏的term的总数最大只可能是4,这里不明白。明明遗漏的是3嘛

    作者回复: 因为取回的三个的最小的桶里面是4个。所以遗漏的最大的可能数值是4。注意是“可能最大”而不是“实际最大值”

     1
     3
  • 冷冽
    2019-11-30
    这个termsaggs的例子里面的 doc_count_error_upper_bound经过我实际操作,elasticsearch返回的结果就是6,所以应该是分片1的可能最大遗漏值是4,分片2的可能最大遗漏值是2.加起来是6。经过实际操作可以了解更多细节内容,比如实际操作的时候如果要实现错误场景还需要使用到 size和shard_size两个参数。size表示最终结果返回的数量,shard_size表示从每个分片中聚合的结果返回的数量。shard_size设置为3时结果就不准确了,可以将这个值设置大一点,就可以让结果跟准确
    
     1
  • Geek_5b11b8
    2019-10-04
    关于4+3等于7是遗漏的数据量,我的理解是这样的,首先在左边因为全部在结果里面包含,所以遗漏的最大可能值就是左边数量最小的那个也就是4,而右边因为AB都在结果里面(这也是为什么不是2的原因),所以不能算遗漏而D在合并后丢掉了,所以取值是3,所以和为7,应该是这样的。
    
     1
  • Pantheon
    2019-08-15
    老师,,没明白shard_size的原理,获取更多的bucket吗?那和size有啥区别

    作者回复: size是最终返回多少个buckt的数量。
    shard_size是每个bucket在一个shard上取回的bucket的总数。然后,每个shard上的结果,会在coordinate节点上在做一次汇总,返回总数

    
     1
  • tisson
    2020-02-07
    老师,我发现即使只有1个primary shard,如果记录较多,设置返回的size很小,那么默认不设置shard_size的情况下,结果仍然会不准确,sum_other_doc_count的值仍然会很大,请问这是正常的吗? 那么我还是需要把shard_size设置得很大?
    
    
  • PLADahuzi
    2019-12-20
    这个shard_size还是没理解的了,能帮忙说的在详细些吗?
    
    
  • PLADahuzi
    2019-12-20
    但是我有个疑问,coordinate节点是怎么知道整个索引的文档数的总数的,
    
    
  • PLADahuzi
    2019-12-20
    看了对下面同学的恢复后,我的理解是,doc_count_error_upper_bound这个值是在coordinate节点上面推算出来的,不是各个分片返回了遗漏的桶的文档数,所以所再coordinate节点上面只能拿到各个分片返回的桶中文档数,而coorditnate节点要推算的话,只能取各个分片返回的桶中文档数最小的数进行累加,得到的值就是推算出来的有可能遗漏的最大的文档数;这样对不
    
    
  • PLADahuzi
    2019-12-20
    关于doc_count_error_upper_bound这个参数,我觉得老师你讲的很难理解,我这么理解你看对不对:
    首先是各个分片自己聚合分桶返回结果,遗漏了D(3),右边的分片遗漏了C(1),然后是再coordinate节点上进行二次聚合的时候遗漏了右边分片返回的D(3),所以最后这个被遗漏的分桶包含的文档有可能的最大值是 3 + 1 + 3 = 7
    老师我这么理解对不对???希望能得到恢复,感谢
    
    
  • 踮脚时光
    2019-11-07
    没有说明白为什么是 4+3
     1
    
  • Frode
    2019-10-02
    老师 请教一下 您建议使用rest api 的意思是什么?例如我用java开发,使用resttemplate来发送dsl语法,获取json数据么?我现在用的是springdata的api,用的像是9300的端口呢,并且不熟悉api的用法,操作很麻烦。

    作者回复: 9300是transport API。9200是rest api。rest api就是基于http的。支持使用全部的es的dsl。你可以看一下后面关于java调用es的相关课程。你可以调用hlrc。在全部课程的倒数几个视频中

    
    
  • Geek_0ac7f5
    2019-09-16
    老师,cardinality可以精确统计吗?
    
    
  • Ryoma
    2019-09-05
    一个分区可以支持多少文档数或文档大小,或者老师可以给个经验标准

    作者回复: 一个shard的存储容量控制在30gb 以内,后面容量规划中有相关的讲解

    
    
  • Jayden
    2019-08-28
    能否增加集群性能优化的讲解。现在我们遇到查询性能问题,TP99怎么能够优化提升
    
    
  • RXTM
    2019-08-18
    老师,我想问一下coordinate节点和普通的节点一样会存储数据么?还是它只负责协调?

    作者回复: 任何节点都具备coordinate的能力,也就是说你无法配置一个节点,不具备coordinate的角色。但是你可以配置只负责coordinate的节点。数据存储,都保存在数据节点上

    
    
我们在线,来聊聊吧