• hellochenpro
    2019-07-11
    阮老师,你好。
    我在用 "aggs" 做聚合查询的实验时,发现,在第一行如果用 "size": 20 ,这样聚合查询会不成功,返回了类似 match_all 的查询结果。如果用 "size": 0 ,则聚合查询的结果正常。
    请问,对于“size”:0 和 20,这两个值的差别是什么?

    作者回复: 做聚合分析,应该讲size 设置为0,否则会返回查询结果。写20,aggs的相关结果会出现在比较后面而已。

    
     5
  • Geek_5b11b8
    2019-07-14
    聚合结果,有些是不准确的,老师也可以介绍一下

    作者回复: 后续有章节讲解

     5
     2
  • 茗
    2019-07-14
    GET movies/_search
    {
      "size": 0,
        "aggs": {
         "years": {
         "terms":{
                    "field":"year"
                }
         }
        }
    }
    老师,您好,我用上边的查询方式查之前的movies index,发现数据不是很全,没有1995年的,实际数据是有1995年的,这个是怎么回事呢?
    展开
     1
     1
  • Geek_b36bac
    2019-11-16
    有一个问题想请教一下,在您的demo中,根据目的地进行聚合分组后会得到不到目的地的航班信息,现在我有两个需求,不知道能不能有很好的实现方式:
    1、根据目的地聚合分组后,需要返回该分组的所有航班信息列表(即文档数据),这个数据能在聚合查询的时候同事返回吗?如果能,dsl该怎么写?
    2、聚合后分组数特别多(比如说聚合分组后有1000个目的地),可以对这1000个目的地做分页查询吗?(类似于from+size分页,真分页)
    
    
  • PLADahuzi
    2019-09-30
    老师我想问下我在es中按照商品的sku的维度写入的数据,现在我根据sku中的spu no进行聚合分桶,我想拿到每个桶中第一个sku的文档,但是只能能拿到spu 的no,现在我要怎么才能拿到桶中的第一个文档啊
    
    
  • godtrue
    2019-09-20
    老师好,请问后面会有这些聚合功能的原理讲解嘛?
    分布式的数据每个分片存储部分数据,像最大、最小、计数等分表计算再比较或累加,不过分组和求平均值需要全部数据后才能得到吧?ES具体是怎么实现这些聚合功能的?
    
    
  • Cybertrunk
    2019-08-26
    It's odd. in kibanan discovery, I use filter bar to search "DestCountry" which equals to "IT", then i got 2007 hits. But, when i use the follow aggs in console, it gives me the answer of 2371. i use ES7.3.
    -= agg query in console =-
    GET kibana_sample_data_flights/_search
    {
      "size": 0,
      "aggs": {
        "flight_dest": {
          "terms": {
            "field": "DestCountry"
          }
        }
      }
    }
    -= result =-
    {
      "took" : 0,
      "timed_out" : false,
      "_shards" : {
        "total" : 1,
        "successful" : 1,
        "skipped" : 0,
        "failed" : 0
      },
      "hits" : {
        "total" : {
          "value" : 10000,
          "relation" : "gte"
        },
        "max_score" : null,
        "hits" : [ ]
      },
      "aggregations" : {
        "flight_dest" : {
          "doc_count_error_upper_bound" : 0,
          "sum_other_doc_count" : 3187,
          "buckets" : [
            {
              "key" : "IT",
              "doc_count" : 2371
            },
    ......
    }
    Sorry, and msot wierd, when i use edit in DSL from filter setting in filter bar. it gave me the following answer.
    -= in DSL =-
    {
      "query": {
        "match": {
          "DestCountry": {
            "query": "IT"
          }
        }
      }
    }
    then I use this to search in console, I got the answer of 2371, which equal to using agg.
    -= query in console =-
    GET kibana_sample_data_flights/_search
    {
      "query": {
        "match": {
          "DestCountry": {
            "query": "IT"
          }
        }
      }
    }

    so, do we trust the result of filter bar in Kibana Discovery ?
    展开
     2
    
  • 陈子文
    2019-08-08
    ES中的查询以及聚合,可以跨index吗?如果可以,这部分有讲解吗?

    作者回复: 可以啊,跨index只需要在index中写上index名字,用逗号间隔,或者用通配符

    例如

    post index1,index2,logs*/_search

    代表搜索index1 index2和全部log开头的索引

    
    
  • GaelYang
    2019-07-24
    老师请教一下,对于nested类型的数据,怎么返回真实的命中数呢
    
    
  • SuperSnow
    2019-07-16
    阮老师,您好!看了其他人的留言,我有一个问题,关于ES可以当成时序数据库。
    es更重要的点是获取数据,然后搜索和分析数据吧。如果当成类似hbase之类的数据库是不是有点失去重点的感觉,虽然es可以当成这种类型的库存在。
    因为前两天看了一篇文章,关于陶建辉将他写的用于物联网的TDengine的大数据平台开源了,号称比hadoop快10倍。当时我问了一个问题,就是他的这个平台与ES的区别,当时他说:我们处理的是结构化的日志数据,比如物联网、车联网的各种传感器、机器产生的数据,ES主要做文本数据的搜索和处理。
    那我的问题是:
    1)ES除了可以存储非结构数据,也可以存储结构性数据,是否可以将ES当成大数据库来用呢?
    2)由于ES在处理数据的效率比hadoop快,这只是get的效率。那write的场景,用es来落地是否合适?还是说业务操作的数据还是存储在类似RDBMS,hbase之类的库中,然后与es搞同步,目的主要是用es的搜索与处理的这些闪光功能点呢?
    展开

    作者回复: 日志处理属于es的常用case。用来做日志类数据,完全可以把es当作数据库使用,本身他就支持水平扩展。

    对于一些交易信息,对于数据的trasaction要求比较高,同时数据的update操作又很多(日志型的数据其实update很少的),这时就考虑用数据库做同步。作为同步。

     1
    
  • zj
    2019-07-16
    flight_dest这个表示什么含义

    作者回复: 航班的目的地

     2
    
  • Y
    2019-07-12
    老师 用aggs做聚合分析的时候 sum_other_doc_count 返回的是指定聚合字段为空的数据吗 我看下来好像不是 还是说聚合分析最多返回十条buckets?
     2
    
  • 南山
    2019-07-10
    期待kibana是如何与这些聚合信息相结合的,另外编程语言提供的API有没有只关注结果数据的功能呢?

    作者回复: 不知道你说的只关注结果数据的功能是什么意思。

    JAVA有high level的client

     1
    
  • robincoin
    2019-07-10
    elasticsearch可以用作时序数据库么,时序聚合分析效率如何?

    作者回复: 可以。例如grafana就可以运行在es之上。es自己也有timelion,就是用来分析时序数据的

    
    
我们在线,来聊聊吧