新知一下
海量新知
5 9 0 9 3 0 8

微众银行范力欣:联邦学习—建立隐私保护下的可信人工智能

算力智库 | 最深度的数字经济产业智库 2021/06/05 06:43

6月3日,由算力智库主办,中国信息通信研究院云计算与大数据研究所、隐私计算联盟、隐私计算技术联盟联合主办的2021第二届隐私计算产业与应用论坛在上海圆满收官。作为国内首个聚焦隐私计算领域的年度行业权威盛会,本届论坛再度召集众多政府机构代表、业界及学界大咖,畅谈数据智能时代隐私计算的广泛应用前景及巨大商业价值。

在论坛上,微众银行人工智能首席科学家范力欣发表了题为《联邦学习—建立隐私保护下的可信人工智能》的演讲。范力欣表示,当前数据要素在各个企业中,这些数据是分布式的,关键是怎样用人工智能的算法把他们联系起来,做成一个联盟。“联邦学习面临的挑战是,怎样在尊重用户隐私的条件下,充分发挥数据价值,另外也要打破数据孤岛,连接数据发挥它的价值。”

新知达人, 微众银行范力欣:联邦学习—建立隐私保护下的可信人工智能

以下为算力智库整理的演讲全文:

范力欣:大家下午好!非常荣幸和大家分享《联邦学习—建立隐私保护下的可信人工智能》,我刚才听各位老总的讲话,我还在做笔记,在座的都是同行,一位非著名相声演员说“同行是冤家”,我们隐私计算联盟的同行就不是冤家,恰恰相反,大家是在一起来做隐私计算的产业。

我和大家分享两个关键词:第一,人工智能。第二,隐私保护。他们两者之间是什么关系,人工智能为什么需要隐私保护,它的答案就是联邦学习,我希望今天讲完以后,大家对这个有一个大概了解,也欢迎各位专家批评指正。

这是简要的概述,背景是可信人工智能为什么需要数据隐私保护。我们先看一下,从国家战略层面,大家都知道人工智能是非常重要的,既是科技前沿也是经济的主战场。学术层面来讲,人工智能有一些概念需要理清,有深度学习、机器学习、认知计算,从算法、系统到理论,也分了一些流派。

这是1998年图灵奖获得者,由于他的坚持不懈,用几十年努力把深度学习带到大家眼前,影响超出人工智能领域。深度学习有什么特点?这是1998年的模型,当时的参数6万,到了2012年是6000万,再到2019年GPT215亿,2020年GPT3是1750亿,但是有一个重要的过程叫做训练或者学习,我们对这么多的参数模型进行训练学习的时候需要用什么?需要用奥数据,GPT2用45TB数据,这些数据从哪里来,就回到今天的主题,前面已经讲到数据要素在各个企业、各位手机中,这些数据处在什么样的状态,它是分布式的,分布到上亿手机用户的手机中,或者是各个机构,一些垄断性机构或者一些小的机构中,这些数据处在一个分布的状态,我们怎样用人工智能的算法把他们连接起来,或者是联邦起来,或者做成一个联盟。

欧盟GDPR大家非常熟悉,我不多讲,这里要强调一下,在国家政策层面不弱于欧盟,2009年到2021年,一系列法规的出台,而且有一个特点,它是刑法。数据要素市场是国务院从上至下的政策,我们还是要继续做这些事情,一方面要安全合规利用数据进行人工智能学习和建模,另外一方面要合规的做这件事情,所以做联邦学习面临的就是这样的挑战。一个是在怎样合规尊重用户隐私的条件下,充分发挥数据价值,另外一个也要打破这个数据孤岛,来连接这些数据发挥它的价值。

这是从数据应用层面的使用价值。简单的总结就是数据不动,模型动,数据可用不可见。技术上不想详述,我想强调一点,所谓横向就是To C端大家手机端的联邦建模的形式。另外一个纵向的就是B端,不同机构、银行、保险公司他们进行建模,由于他们的数据在维度上很可能不同,这是一个纵向的建模形式。

今天张总和罗总都在讲这个事儿,就是说我们做联盟,我参与这件事儿或者做隐私计算共同建模型的时候好处是什么,我能够得到什么。有很多学术上的研究,比如说这是当初的学术文章,通过做游戏的方式模拟激励机制多次往复最后达到纳斯均衡的情况下,得到一个合理的分配,可以说是先期的研究,但是把眼光放远一点,也许是我们不得不达到的状态,本质上是新型生产关系的建立。

这里分了三类的隐私计算的方法,具体到联邦学习来讲,有一个特点或者有两个特点:第一,主要做开源生态,允许很多合作方来共同建立开源的技术平台,国家技术可控角度来讲有自己的专利、自己核心的标准,技术上或者学术上有一些长期的积累,至少有一个自己的方案,不在特定情况下受制于人,行业标准在积极的制定过程当中。

这是案例:第一,通过联邦学习服务更多的小微企业,这是和我们微众银行的微业贷的业务是直接支持的技术平台,现在微业贷支持将近百万小微企业,这些小微企业一方面技术能力不强,另外一方面即使是有一些数据,但是数据非常孤立零散,通过这种方式能够得到比较明显的提升,对整个金融放贷风险判断有明显的提升。另外就是反欺诈、反洗钱。最后一个大的方向,就是医疗,医疗数据也是非常敏感的,在疫情发生之前,我们和5家医院进行建模,前面有三甲医院,数据比较多,后面都是非常小的社区型医院,做判断非常困难,对于小医院通过联邦得到了整个判断非常大的提升,相当于数据扶贫工作,帮助到这些比较小的一些机构或者企业比较大幅度的提升服务质量。

现在背景是监管越来越严,要利用这个数据必须要合规的,联邦学习站在人工智能和隐私计算的交叉口上提供了这样一个解决方案,整个生态发展也是在蓬勃发展的。

谢谢大家!

更多“人工智能”相关内容

更多“人工智能”相关内容

新知精选

更多新知精选