蚂蚁摩斯:利用多方安全计算破解数据合作难题
极客时间编辑部
讲述:初明明大小:4.95M时长:05:25
你好, 欢迎收听极客视点。
如今,越来越多企业和机构意识到数据隐私安全保护的重要性。过往,多机构数据联合使用更多是依靠法律层面的合同文书来限制使用方的行为,一旦出事,再多赔偿也无法有效弥补用户隐私泄露的损失。因此,技术手段是必要的,从技术角度保证数据的多方使用者无法拿到原始数据,无法超范围使用数据是避免数据泄漏和滥用的有效手段,这也是最近几年相关技术在市面上影响力越来越高的原因,比如多方安全计算。InfoQ 采访到了蚂蚁摩斯安全计算平台研发人员逸昊,了解多方安全计算的应用场景和技术难度。
多方安全计算是什么?
采访中,逸昊表示多方安全计算是密码学很重要的一个分支,其作用是在不泄露数据情况下实现协同计算,即让多方基于共同的数据进行一个 function 的计算得到最终结果,但数据和中间计算结果在这个过程中不会泄漏给任何一方。这里提到的 function 是广义层面的含义,可以指计算任务、机器学习任务、数据检索等。
你可能会疑惑多方安全计算与联邦学习之间有什么区别。目前业界公认的只要是场景基于多方数据进行联合建模,且各自原始数据不对外输出,由中心方进行协调的建模都可以称为联邦学习。
联邦学习和多方安全计算既有共同点也有区别,二者的应用场景有很多共同点,而许多场景中,联邦学习跟多方安全计算相比是牺牲隐私保护的程度换取性能提升、实现简化。
联邦学习起初主要应用在 C 端,而随着机构之间的合作越来越多,需要根据不同的应用场景选择不同技术方案,尤其是训练敏感的金融风控场景,多方安全计算被日益重视。
多方安全计算的应用场景
除了多方安全计算,行业还提出了多种方案来保护数据隐私。跟传统的多方安全多方计算的理念不同,一些流行的方案采用隐私换性能的思路,部分应用多方安全计算技术或采用其他隐私计算来计算,只保护了部分数据、部分计算过程,泄露了中间计算结果。这些方案主要适用于“横向联合”场景:数据来源于每个终端,各终端间的数据是同质关系。这种情况下其他方案一般泄露的中间计算结果是批量样本的汇聚信息,泄露的敏感信息相对较少。
但如果是“纵向联合”的场景,例如大多机构间的数据合作,沿用这类方案在隐私保护上就要特别小心。如果还是让一个中心方得到模型或各方都得到部分模型,在很多 2B 场景这种方式是不可接受的,尤其是训练敏感的金融风控模型。同时,这类方案在“纵向联合”泄露的中间计算结果更容易包含敏感信息。在“纵向联合”的场景更适合完全应用多方安全计算技术全方位保护所有敏感数据和整个计算过程。但需要注意的是,这里应用的挑战很大,需要很好掌握多方安全计算技术和细细打磨产品。
多方安全计算的技术难点
在算法方面,多方安全计算涉及的隐私保护技术和算法非常多,其由四大类截然不同的基础隐私保护算法组成:分别是秘密分享、混淆电路、不经意传输、同态加密,其中又可细分出很多不同的算法,功能不一,能做的运算不同,性能优缺点等都不一样。通常,对于不同的计算任务,比如不同的统计指标还会有各种各样的算法。在商业应用中,为满足性能和安全性要求,还需要配合使用一些其他技术。比如为了满足安全性要求,还需要配合使用零知识证明算法。要掌握这些算法、灵活组合运用、实现它们以及设计新的算法去满足业务要求,其实难度很高。以蚂蚁摩斯多方安全计算平台为例,它使用了 30 多种隐私保护算法,且这些算法实现难度很大。
在当前的多方机构数据合作场景中,多方安全计算节点会部署到各个机构,实现“数据不出域、数据隐私不泄露”的安全合作。那么,除多方安全计算算法外,异构网络下的分布式计算也是一大难度。
在逸昊看来,多方安全计算平台是一个分布式大数据系统,这个大数据系统与很多互联网公司或企业内部的大数据系统差别很大:首先这涉及多管理域,多管理域的大数据分布式拓展是一个难点。更复杂的是,每个机构的网络架构不同,网络安全策略不一,计算资源和网络资源都差异很大,要把整个系统的性能和可靠性维持到很好的程度,挑战很大,甚至还要把各机构之间的节点做到网络互联互通。
此外,在当前的机构环境下做到远程部署、维护和升级也是一大难题。综上,多方安全计算的技术难点一是体现在算法层面;二是涉及多机构的分布式系统管理。
以上就是今天的内容,希望对你有所帮助。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论