• 人唯优
    2019-08-21
    平台的自然语言理解(NLP)的数据处理模块可以分析视频数据,自动生成视频字幕。
    感觉这里不是很严谨,字幕这块应该是OCR+ASR为主吧

    作者回复: 不管是OCR还是什么都是一种数据处理。我们这里的数据处理指的是一种抽象

    
     1
  • Ming
    2019-06-26
    我也有个小问题:在实践中一个集群往往同一时间只能执行一个pipeline吗?假如一个产品需要用到文中的全部四个例子,两个流处理两个批处理,实践中往往是有四个集群,还是一个集群?

    作者回复: 一个集群有可能同时执行两个pipeline的

     1
     1
  • cricket1981
    2019-06-26
    Beam Pipeline的合并模式是否支持keyed join,inner/left outer/right outer/full outer都支持吗? 看上面的代码示例虽然是叫Joiner Pattern,实际效果却是Union。分离模式倒是跟flink的split/select算子组合很类似。

    作者回复: 你这个问题问的很好啊,beam的join的确没有sql的join那么丰富。这是因为性能的原因只提供最基本的join。和union是不一样的,union指的是column一样的时候叠起来。

    
     1
  • 蒙开强
    2019-06-26
    老师你好,我问一个大数据相关的问题呢,在大数据处理场景中有没有什么好的CDC方案额。

    作者回复: CDC是什么?

    
     1
  • abc-web
    2019-08-24
    老师,你的课程是否有实际的实例代码,这样学习效果会更好些;
    
    
  • juan
    2019-07-03

              @ProcessElement
              public void processElement(ProcessContext c) {
                if (isFiveStartMember(c.element())) {
                  c.output(c.element()); // 忘了 starmemember ???c.output(fiveStartMemberTag,c.element());
                } else if (isGoldenMember(c.element())) {
                  c.output(goldenMembershipTag, c.element());
                } else if (isDiamondMember(c.element())) {
         c.output(diamondMembershipTag, c.element());
        }
              }
            })


    展开
    
    
  • JohnT3e
    2019-06-26
    老师,有几个问题不解。在复制或者分离模式下,每个处理和输出是不同步的吧,如果业务上对不同输出有同步要求时,怎么办?复制或者分离模式和组合模式进行组合时,上一步的输出不同步或者延迟较大会加大后续组合时数据业务时间乱序问题(特别是流处理)这时有解决办法吗或者其它思路
    
    
我们在线,来聊聊吧