蚂蚁集团吴行行:可用不可见的隐私计算,助力数据释放更大价值

原创
云计算 区块链
数字时代,数据要流转起来才能发挥其驱动作用,但数据的流转在安全和隐私方面存在着天然风险,隐私计算技术能够实现数据处于加密状态或非透明状态下的计算,以达到各参与方隐私保护的目的,因此,隐私计算成为了业内看好的数据基础制度建设支撑技术之一。

数字时代,数据要流转起来才能发挥其驱动作用,但数据的流转在安全和隐私方面存在着天然风险,隐私计算技术能够实现数据处于加密状态或非透明状态下的计算,以达到各参与方隐私保护的目的,因此,隐私计算成为了业内看好的数据基础制度建设支撑技术之一。

早在2016年,蚂蚁集团就开始进行隐私计算相关的研究。其中,蚂蚁链隐私协作平台FAIR由蚂蚁数科蚂蚁链团队开发,融合了隐私计算、区块链、可信计算技术,来解决数据流转过程中的可用不可见。FAIR是面向数据全生命周期的安全开放、价值流转的基础平台,通过隐私计算解决了数据隐私保护问题,还融合区块链技术解决了数据权属问题和真实性问题,实现全流程的可验证与可追溯。

“区块链和隐私计算在数据管理方面是具有互补性的,FAIR架构就是深度融合两种技术。这样让数据能够在不出域的情况下发挥它的价值,另一方面可以让多个参与方之间的协作能够更加高效。FAIR平台不是从技术组合的角度思考应用,而是我们站在了数据全生命周期管理的角度,去思考什么技术手段能够解决实际问题。” 蚂蚁集团技术专家吴行行(花名:俊逸)解释说。

去年九月,FAIR平台宣布整体架构升级。目前,FAIR已经兼容全类型隐私计算选型,实现了与隐语、FATE等隐私计算开源框架以及摩斯等隐私计算系统的对接互通。同时大规模计算性能得到进一步增强。除了FAIR平台,2022年蚂蚁集团还发布了可信隐私计算“隐语开放平台”,面向全球用户开放,帮助用户低成本探索隐私计算应用场景。

获得权威机构和大赛的认可

目前,FAIR平台通过了信通院等权威机构的多项评测。以TEE评测为例,除了常规的功能性、可扩展性、高可用等要求,蚂蚁链团队还对常见算法和密码算法进行了抗侧信道保护,这帮助其全项通过了评测。“TEE技术的安全假设是很强的,可以做到不信任操作系统、管理员等。但是cache、页表等底层资源还是共用的,这会引入部分侧信道问题。我们认为有必要解决这类问题,来提高整个系统的安全水位。在具体解决方式上,得益于我们TEE引擎平台良好的模块化设计,来替换一些安全算法即可。”吴行行介绍说。

2022年,吴行行带领团队参加了iDASH隐私计算大赛,并以领先第二名5倍的绝对优势夺冠。

据悉,iDASH是目前在隐私计算和数据隐私保护领域国际最高规格的竞赛,由美国国立卫生研究院(NIH)主办,每年举行一次。2022年的iDASH竞赛共有来自全球十多个国家和地区的八十多支队伍参加。iDASH大赛旨在应用集群化TEE机密计算技术和机器学习的聚类算法,解决大规模转录组基因数据的隐私保护和标签缺失的问题。蚂蚁链团队在2018年就开始在TEE方向进行了探索。蚂蚁链推出的基于TEE的链上隐私保护方案发表在数据库顶会 SIGMOD 20上,并于2021年获得CCF科技进步奖。同时还有基于TEE的链下机密计算平台,自上线以来保持日均超百万的调用量,服务多个线上业务。

比赛中,蚂蚁链平台团队从算法并行改进和工程实现两方面进行了深入的优化,最终在满足安全性要求的前提下,算法评估的指标ARI结果比其他参赛队伍高出3%,并且计算框架在1.6s内就能完成大规模基因数据聚类的集群计算任务,是其他参赛队计算速度的5倍以上。

在金融风控场景的成熟应用

隐私计算已经应用于很多行业的不同业务场景。在政务行业,隐私计算技术可以提供政府数据,与电信企业、互联网企业等社会数据相融合,比如联合多部门的数据对道路交通状况进行预判,减缓交通堵塞。在金融行业,隐私计算技术可以应用于获客、风控和反欺诈等业务环节。在医疗健康行业,隐私计算技术能够保护患者隐私,有望打破医疗数据孤岛现象。

目前,蚂蚁集团的隐私计算目前主要应用于公共数据开放共享、金融风控和联合营销的场景。吴行行对金融风控场景进行了详细介绍。该场景包括反洗钱、反欺诈和信用卡风控等。

当前金融风控审核大多通过机器学习得到风控模型,实现快速审核,精准识别风险的效果。而建模面临的挑战主要是缺乏能支持信贷模型评估的可靠数据。FAIR融合了隐私计算、区块链与数据安全技术,实现多方可共建数据融合实验室,可支持多方基于隐私加密数据进行模型共建部署与实时预测分析,解决个人隐私信息保护和数据流转计算的两难问题。与单一数据源模型相比,联合建模可提升模型精度,提高风险客户的识别率,进一步提高资产质量,降低经济损失;多方数据协作下可采纳多维度的数据源,可提升通过率,扩大潜在的低风险客户群。

辅助数据要素流转和价值释放

谈到隐私计算未来的发展趋势和最终价值,吴行行认为,隐私计算更大的发展空间是在于辅助数据要素流转和价值释放。数据是数字经济时代重要的生产要素,是构建新发展格局的重要支撑。而直接共享原始数据进行数据流转的方式,无法对共享出去的数据进行有效的管控和保护,既不利于保护数据资产权益,也无法防止数据滥用和隐私保护。隐私计算结合区块链、可信计算等技术,可以解决数据流通过程中,数据共享与隐私保护之间的天然矛盾。

嘉宾介绍

吴行行毕业于清华大学计算机系。在校期间,他接触到了区块链、隐私计算技术,被共识算法、密码算法等新颖的技术和溯源、供应链金融等场景吸引,感受到了技术对生活的深远影响,决定深耕区块链和隐私计算领域。“区块链上的参与方能够分布式、高效得进行协作,直接降低了产业链的多方协作成本,这是最吸引我的地方”。吴行行表示。

2019年,吴行行加入蚂蚁集团,继续深耕隐私计算领域。现在主要负责FAIR平台的底层算法工程,包括联邦学习、多方安全计算、可信执行环境、隐匿查询、数据分析等多种技术路线和引擎的框架建设和算法研发工作。

 

责任编辑:赵立京 来源: 51CTO
相关推荐

2022-04-25 11:44:58

数据隐私安全

2021-07-22 23:04:41

区块链数据技术

2013-03-13 16:14:19

虚拟化大数据

2022-07-05 14:26:36

隐私计算开源

2013-03-08 17:24:47

IBM

2021-05-08 10:15:16

戴尔

2021-08-06 12:48:13

区块链隐私技术

2018-07-19 14:34:48

数据中心监控网络

2021-10-29 15:24:48

洞见科技

2022-08-01 17:35:53

计算技术

2021-01-11 14:01:59

大数据税收疫情

2021-11-11 17:43:00

数字化

2022-07-28 16:41:58

物联网

2022-06-21 17:49:55

隐私计算TEE

2014-10-13 18:14:49

XTools CRM

2019-10-23 17:33:25

华为云数据库锦江都城

2014-05-21 16:14:51

Teradata 大数据天睿

2022-07-14 18:46:13

蚂蚁集团隐语开源

2021-11-02 12:44:02

深信服

2017-07-13 10:14:20

大数据动向数据价值
点赞
收藏

51CTO技术栈公众号