• Geek_c52e59
    2019-11-06
    請教老師,我們目前在生產環境使用的protocol是transport的方式,不是RESTFul API,請問這樣的狀況下增加coordinate node 做查詢的load banlancer是有用嗎的?

    作者回复: lb是基于9200走的http。transport走的是9300,估计你是通过将一组node的ip加入配置文件来实现的吧?这种情况下,通过增加节点也可以实现水平扩展

    
     1
  • 张红泽
    2019-10-17
    老师我们现在一个索引10个主分片,现在每个主分片80g,现在我们需要增加分片数量,增加到 100个,会造成集群查询变慢吗

    作者回复: 单个分片的尺寸最好控制在50G以下。单台机器,每一个G的内存,分配20个以下的分片。

    你现在突然将主分片扩到100个,每个上面只有8g,这肯定是over sharding了

    
     1
  • 亚伦王
    2019-12-21
    老师,我想问了一下es中的数据是怎么存储的,是主要的数据都存储在磁盘里吗?那内存里是会存储什么类型的数据吗? 或者举个列子 一个集群3个节点 每台配置都是32核64G 内存 500G磁盘,那理论上这个集群是可以存储1500G左右的数据吗?
    
    
  • godtrue
    2019-09-22
    还未做过类似的工作,不过感觉和关系型数据库的容量规划是类似的,老师讲解的挺好,大体原则清楚了。目前组内的另一个同事其实就遇到了关于ES写入慢的问题,不过具体的mapping和es集群的配置不太清楚,是一个定时任务跑一次会产生大量的数据,她会将产生的数据写入ES集群用于后期的展示,一次会产生7.4T的数据,跑一次任务需要一两个小时,是日志性数据,也许可以利用老师的讲解稍微优化一下。
    
    
  • 金hb.Ryan 冷空氣...
    2019-09-19
    请问hot warm架构会介绍么

    作者回复: 有介绍的

    
    
  • 飞飞
    2019-09-09
    请教老师,我们的项目上单表已经达到6t,目前是250多个分片,有什么好的机制能实现更快的数据入库么?

    作者回复: 数据入库如果为了提高写性能,可以参考提高写性能一节。总体来说可以通过修改refresh和translog,牺牲查询实时性和数据稳定性提高tps。

    单表数据6t 如果要写入索引,如果是时间序列数据,可以建立timebase的index。如果不是,可以考虑按照字段进行划分索引,例如按照订单的地区,cn,us,划分不同的索引。然后,当然索引得主分片,确保单个分片的尺寸在30g以下

     1
    
我们在线,来聊聊吧