• Chang
    2019-07-24
    老师,我对会话窗口的理解不知道对不对:像文中的例子gap是5 min的话,假设有一个数据流每4分钟一个流入一个数据,是不是只需要一个窗口?

    作者回复: 谢谢你的提问!是的,按照你说的情景最终只会产生一个会话窗口。

    
     1
  • W.T
    2019-07-10
    老师,文章读完有两点疑惑的地方:
    1、文中滑动窗口样例,窗口大小1小时,滑动周期30分钟:
    [July 8, 2019 0:00:00 AM, July 8, 2019 1:00:00 AM)
    [July 8, 2019 0:30:00 AM, July 8, 2019 1:30:00 AM)
    [July 8, 2019 1:00:00 AM, July 8, 2019 1:30:00 AM)
    [July 8, 2019 1:30:00 AM, July 8, 2019 2:00:00 AM)
    ……
    最后两条是否笔误了?窗口大小固定是1小时,我的理解应该是下面这样:
    [July 8, 2019 1:00:00 AM, July 8, 2019 2:00:00 AM)
    [July 8, 2019 1:30:00 AM, July 8, 2019 2:30:00 AM)
    2、会话窗口是否可以这么理解:指定一段时间,在这段时间范围圈定的数据集上去应用固定窗口。
    请老师指教,谢谢!
    展开

    作者回复: 谢谢你的留言!
    1、是的呢,eagle eye啊,已经给编辑部反映修改了。
    2、如果我没有理解错你的留言的话,应该是每次得到一个新数据后,如果这个新数据的时间戳和之前的会话窗口边界相差没有超过Duration Gap的话,就将这个新数据归入会话窗口中,并且再将窗口向外延时Duration Gap的时长。

    
     1
  • cricket1981
    2019-07-08
    beam支持动态session gap定义吗?全局窗口的作用和使用场景是什么?beam支持自定义窗口吗?

    作者回复: 谢谢你的留言!动态定义sessino gap说实话我没有尝试过,所以我不确定给同一个PCollection设置多次Sessions Window的话会不会报错。

    全局窗口的一个用处是在处理无边界数据的数据集时,配合触发器使用。例如每隔N段时间计算现有的所有数据平均值。

    自定义窗口Beam现在应该是不支持的。

     1
     1
我们在线,来聊聊吧