基于Flink的在线实时反欺诈系统的建设与实践
极客时间编辑部
讲述:杜力大小:4.20M时长:03:04
在大数据时代,金融科技公司通常借助消费数据,来综合评估用户的信用和还款能力。这个过程中,某些中介机构会搜集大量的号并进行“养号”工作,也就是在一年周期里让这些号形成正常的消费、通讯记录,目的是将这些号“培养”得非常健康,然后卖给有欺诈意向的用户。这类用户通过网上信息提交审核,骗到贷款后就“销声匿迹”了。
那么,如何更快速地预防或甄别可能的欺诈行为?如何从超大规模、高并发、多维度的数据中实现在线实时反欺诈?这些都是金融科技公司当下面临的主要难题。针对这些问题,InfoQ 专访了玖富集团,揭秘基于 Flink 的超大规模在线实时反欺诈技术是如何快速处理海量数据并打造良好的用户体验。
据了解,金融科技因其虚拟性特征,主要风险集中在欺诈风险和信用风险两方面。因此,核心风险评估流程就是反欺诈和信用评估。对于反欺诈而言,信息核实、高危人群拦截和实时计算、识别、决策是其核心风控手段。对于信用风险评估,则需要内外兼修。
Flink 开源项目是近一两年大数据处理领域冉冉升起的一颗新星。虽然是后起之秀,但是在国内许多大型互联网企业的工程实践中均有被应用,如阿里、美团、京东等。
从技术语言角度:Spark 的技术语言主要是 Java 和 Scala,尤其是对 Scala 语言有一定要求。而 Flink 主要是基于 Java,编程语言更成熟,通用度更高,修改代码也更容易。所以从语言层面综合来看,Flink 相对较好。
从与现有生态体系结合的角度,Flink 与超大型计算存储结合比 Spark 和 Storm 要好很多,同时接口也更友好。HBase 是整个系统预查功能的缓存基础,预查功能是降低系统延迟最重要的技术优化手段。
据介绍,玖富基于 Flink 的超大规模在线实时反欺诈系统的架构分为两部分:数据部分和决策部分。整个系统的运作相当于工作流,用户数据信息以流形式由一个节点传到下一个节点,在流转过程中会产生大量决策信息,根据条件做出筛选和判断,并把判断结果快速推行到下一节点,从而实时判断用户数据情况,进而决定是否放款。
对于该套在线实时反欺诈系统的未来规划,玖富第一步会针对 Flink 技术本身,结合玖富在技术、场景等方面的积累,把基于 Flink 的超大规模在线实时反欺诈系统打造成一款数据产品,使其具备向外输出数据资产和数据处理的能力。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论