新知一下
海量新知
5 9 7 0 4 4 3

隐私计算的数据“可用不可见”

数据化运营专家 | 大数据应用专家 2021/08/07 19:25

 隐私计算或者说是隐私保护计算,是从技术角度实现了数据流通与隐私保护之间平衡的最优解。隐私计算做到了数据的“可用不可见”,既实现了数据价值的流通与共享,又实现了数据的隐私保护。“可用不可见”隐私计算的精髓所在。数据的“可用不可见”,看似简单质朴,实则蕴含着大道理、大智慧。今天我就来解读下何为“可用不可见”。

新知达人, 隐私计算的数据“可用不可见”

1 、商业角度

从商业角度理解,“可用”的目的是要解决商业问题,能为数据源和需求方带来价值,“不可见”是实际商业模式可运行、可落地的基本游戏规则,不遵从这个游戏规则,大家就难以开展商业合作。因此,“可用不可见”从商业角度理解,是让数据共享与协作可以成为商业事实、发挥数据要素价值的一种商业准则。在这个商业规则指引下,数据源可以安全的实现数据价值变现,需求方可以借助外部数据解决自身的业务问题,从而事实上完成了基于数据合作的商业闭环。

2 、技术角度

从技术角度来看,“可用”是指对原始数据和隐私数据要进行加密等必要的技术处理动作,在计算环节要通过加密传输去完成数据的虚拟融合。“不可见”指的从技术角度屏蔽了敏感信息和隐私数据,为不可分享或者不能的数据加上一层安全的“防护罩”,以实现事实上对隐私数据的保护,也就是不明文泄露、不直接明示。所以,“可用”和“不可见”都是指借助技术上的处理来实现跨机构之间数据的“可算不可识”。

新知达人, 隐私计算的数据“可用不可见”

3 、原理角度

名义上的提法是原理角度,实际上我指的“可用不可见”的具体内容。

先说说“可用”。 首先,要明确“可用”是对谁而言的 。当然,“可用”的主体应该是业务方,业务方或需求方才有资格对数据源说对方提供的数据有没有价值、有多大价值。 其次,“可用”的内容后或对象是什么? “可用”的对象特指机构间达成合作的那部分需要加密保护的数据,当然业务方最终想要的并不一定是这部分加密后数据,而是基于这部分加密数据与自身数据完成联合计算后的结果,或者说是加密数据能带给业务方的价值,毕竟很多情况下业务方要的是数据的价值和结果,而非数据本身。 再者,“可用”是一种商业上的共识 ,是业务方对数据能带来价值的认可,是双方在数据安全协作方式上的认同,这是双方建立合作关系的基础。 还有,“可用”是有标准和要求的 ,而且不同机构对“可用”的标准认定还有可能不同,比如 A 机构认为一个计算任务 5 分钟完成是可接受的, B 机构可能任务需要在 1 分钟内完成才算过关。 最后,“可用”不代表“易用”, 要达到商业上的易用,隐私计算要做的事情还有很多,除了算力需要提升,安全性保障、易解释性、透明性等都是从“可用”到易用需要解决的问题。

再来说一下“不可见”。 第一个问题:对谁可见,对谁不可见? 这个涉及到数据的获取与访问权限,当数据源与业务方建立合作时,双方要约定可合作的数据内容,当然还包括哪些数据需要密文传输和计算。在数据操作权限上,可以设置哪些是具备“可见”资格的人,也屏蔽掉没有资格或不希望 TA 看到的人。比如,在联合建模场景下,参与建模的双方只能看到自己本地的数据,无法看到对方的数据。 第二个问题:哪些数据是不可见的? 从大的原则上讲,数据源侧不愿意或不方便对外开放的数据都可以让它们“不可见”,或者在与业务方合作时对业务方进行加密处理。通常来说,在隐私计算领域,“不可见”指的是原始数据和敏感信息不离开本地数据库、不脱离私域,在联合计算时用密文进行传输和计算。当然,联合计算时所传输的中间参数不能倒推出原始值,也是一种数据“不可见”。 第三个问题:如何做到“不可见”? 要做到“不可见”就需要隐私计算的相关技术。目前实现数据的“不可见”有三种技术路径,密码学、联邦学习和 TEE (可信执行环境), MPC (多方安全计算)、差分隐私、同态加密等都在密码学范畴内,联邦学习作为分布式机器学习框架主要面向的是联合建模的场景, TEE 是在类似安全屋的硬件可信环境下实现明文数据间的计算。 第四个问题:如何验证“不可见”? 数据到底能不能被对方看得到,这是需要证明的事情。隐私计算厂商往往能自证安全,将各种 Paper 上的专业文章、已经验证过的技术进行工程化和商业化。为了增强说服力,还需要去找各种权威测评与认证机构做背书,比如工信部信通院的多方安全计算测评认证、银检中心的安全认证等。这些认证都是为了提升在行业客户面前的说服力。

那么,“可用”与“不可见”到底是什么关系? 在笔者看来,两者之间是存在先后关系和因果关系的。先有“不可见”为基础,才能实现数据的“可用”,没有“不可见”的前提条件,后面的“可用”就不成立。所以,“不可见”是前提和手段,“可用”是结果和目标。从业务的角度理解,“可用”是商业模式的可实现,“不可见”是用技术手段来支撑商业的可落地。“可用”和“不可见”不能空口无凭、自说自话,两者同样都是需要被验证的。

4 、法律角度

“可用不可见”只是从技术上实现的数据的安全与合规,但不一定合法,不具有法律效应。合规未必合法,合法也未必合规。隐私计算本身作为一种技术或工具,是具有中立性的,无所谓对错。就像一把刀,好人拿它来切水果,坏人可能用它来杀人,但不能因为坏人拿它来杀人了就说这把刀是一把“作恶的刀”。隐私计算是新生事物,业内目前对于隐私计算的合法地位尚无明确说法。

合法和合规还是有区别的。以金融业为例,合规( Compliance Troubles )是指商业银行的经营活动与法律、规则和准则相一致。从巴塞尔银行监管委员会关于合规风险的界定来看,银行的合规特指遵守法律、法规、监管规则或标准。 广义 的合法,是指不为 法律 禁止 ,与 违法 相对。 狭义 的合法,指符合法律规定。 因此,“可用不可见”是商业语言,而非法律语言。

总而言之,“可用不可见”是数据要素时代实现数据安全流通的重要模式,是体现隐私计算精髓的关键词。隐私计算的“可用不可见”实现了数据所有权与使用权的分离,是对数据安全监管政策的遵从和妥协,也是推进数据要素市场化的关键技术与武器。

更多“隐私计算”相关内容

更多“隐私计算”相关内容

新知精选

更多新知精选