讲师介绍:王振亚,FreeWheel机器学习团队高级工程师,从事计算广告业务中机器学习的算法调研与模型开发工作。他热爱大数据处理分析技术,在日常工作中经常使用Spark进行大数据量的特征抽取与转换。问题背景:在进行一些数据分析或者特征处理时,我们经常会遇到需要使用Spark窗口函数的场景,比如排名、累积分布、移动平均,以及识别当前记录之前或之后的记录。可谓五花八门。这些场景对于开始接触Spark窗口函数的同学来说,往往抓不到主线,本课统一梳理Spark窗口函数的应用场景,以及使用方法。内容看点:使用窗口函数获得具体的分析结果不同的窗口函数类别窗口函数具体介绍
精选留言