基于区块链+隐私计算技术的数据共享平台初探

2022-07-19 12:34 栏目:行业动态 来源:网络整理 查看()

如今,数据已经成为石油的基础关键战略资源,正在颠覆各行业的发展模式。随着数字经济的建设和数据产业市场规模的迅速扩大,数据在各行业中不断产生、流动和交换。

众所周知,数据共享和流通是释放数据价值的关键环节。随着数据交换和共享的增加,所有权、合规性、安全性等诸多风险随之而来。开始出现,导致数据共享困难,隐私无法保障等问题。在保证安全和隐私的前提下,如何实现数据的共享和流通,释放数据的价值,是一个亟待解决的问题。

数据共享业务现状

目前各行业各领域都存在数据拥有者因为诸多因素无法顺利共享数据的问题。包括:

“不愿”共享,数据拥有者无法从共享数据中获益,行业缺乏数据价值评估体系,缺乏对所有共享参与者的激励。

“不敢”共享,数据安全和隐私的需求无法得到满足。数据一旦离开原来的使用场景,就会变得不可控,存在使用不当或滥用的风险,危及自身利益。同时,缺乏对共享数据的实时监控手段和数据使用的授权机制,也存在无法获取共享范围和共享参与者合法性等问题。

“不易”共享,各机构信息标准不统一。无法获得连续、多源、标准化的数据资源阻碍了数据交换和共享效率的提高。

针对当前数据共享面临的三大痛点,业界提出通过区块链隐私计算技术来解决这些问题。

1 隐私计算

隐私计算解决了核心的数据隐私问题,消除了数据持有者“不敢”共享的顾虑。隐私计算技术包括安全多方计算技术(MPC)、可信执行环境(TEE)和联邦学习(FL)来实现隐私数据的安全共享。

其中,安全多方计算主要解决在没有可信第三方的情况下使用多方数据进行安全计算的问题,保证所有数据所有者不暴露除计算结果以外的任何其他数据,用于隐私算术运算、集合运算和统计分析。可信执行环境主要依赖于可信硬件。通过在CPU芯片的帮助下构建一个可信的执行环境,加密的数据可以在这个环境下进行解密和计算,而外部(操作系统、BIOS等。)无法获取这些数据,从而保证了原始数据的私密性和安全性。

在实际应用中,需要在安全多方计算或TEE之上封装应用协议,使私有计算技术可以用于特定场景,包括联合查询、联合统计、联合建模和联合预测。

联合查询:隐私集操作,包括隐藏查询、隐私交集、差集和并集等。

联合统计:数值运算,包括隐私加减乘除、数据的均值和方差等运算。

联合建模:隐私计算建模能力,支持不暴露多方隐私数据的联合训练模型。

联合预测:隐私计算的预测能力,支持参与者离线执行或在线预测训练好的模型。

2 区块链

区块链技术提供了共治共管的能力,负责整个数据流通过程中所有数据参与者、数据使用者和数据流通基础设施运营者之间的可信协作。区块链对数据共享过程中的三个痛点都起到了关键作用。

解决“不愿意”共享的问题:区块链联盟治理提供了数据流通过程中所有参与者之间的协同治理机制,以及数据元素可信数据流通的服务管理机制。通过基于区块链智能合约的投票策略,实现联盟参与者利润分配参数调整、联盟成员准入退出、系统升级改造等交易管理。以解决数据共享者的激励问题。

解决“不敢共享”的问题:不同于隐私计算直接解决数据隐私问题,从而消除“不敢共享”的顾虑,区块链在数据流通过程中保证数据使用、授权和监管的真实性,帮助消除因数据误用、未经授权的数据使用和伪造授权而导致的“不敢共享”的顾虑。通过智能合同确认授权服务,提供各数据的权属关系确认和权限管控能力,结合数字身份等有效机制,确保数据确认授权精准到人;溯源审计服务支持可信数据流通过程中的关键步骤,提供基于可信数据的多维度、全方位的记录审计能力,方便监管机构对数据流通进行全流程监管和查询。

解决“难”的共享问题:区块链技术提供了链上数据目录的数据流转任务的生命周期管理能力,为共享过程提供便捷的检索和流畅的协作服务。其中,链上的数据目录记录了数据流转中涉及的所有数据的元信息,包括数据名称、所属单位、访问方式、发布时间等,并借助区块链的不可更改特性,提供可信数据的搜索、分类、检查等服务;数据流通任务生命周期管理包括分布式隐私计算任务生命周期管理、任务状态管理、参与者管理等。

区块链提供共享安全和可信存储,引入数据共享契约实现数据链上的精准授权,提供数据供需匹配,记录接收、授予、获取的流转和交换记录。通过区块链完成数据使用凭证发放、撤销和使用过程中的争议仲裁。

数据共享的流程

以上从宏观层面介绍了构成区块链数据共享平台的两大核心技术。下面是分享过程,整个技术脉络都是由过程连接起来的。

一般来说,区块链提供了一种可信的元信息存储介质。通过构建数据协作网络,在网络上对业务共享过程进行建模和实现。通过构建业务计算模型,根据链上的元信息对模型进行编程,模型随流程流动,使用本地数据执行,从而达到流程运行和流动中的共享目标。在这个过程中,不需要把不同机构的数据发出去,只共享和传输计算结果。

1 参与者角色

数据提供者,数据的所有者。数据提供程序通过加密技术处理本地用户的数据。

发起者,共享结果的需求者。向平台提供共享任务请求。

参与者是指数据交换和共享任务的实际执行者,他们也提供本地数据参与计算。

协调者,计算任务的协调者,调度过程,计算任务的执行。

在共享任务循环中,可以有一个或多个数据提供者和参与者,协调者必须参与。

2 共享流程

基于区块链的数据共享平台为网络中协同共享的各种数据源构建了一套统一的数据表示、索引、定位、查询、交换和数据溯源审计的实现标准,并提供业务流程定制等能力。它支持共享业务和业务协作的快速开发、部署和实施,实现机构间数据的可信互联,解决数据协同过程中的安全和隐私问题。

该过程分为数据提供者的发布和数据需求者的获取和使用,整个过程分为两个部分:

(1)数据提供者的发布过程

基于区块链+隐私计算技术的数据共享平台初探

导入:数据上传到本地数据共享节点。为导入提供了数据管理的需求,导入过程将统一表示数据。根据导入数据的不同类型,会进行不同的处理,会有碎片和文件系统服务。

命名:通过自描述的数据结构,形成网络的唯一ID,还提供了文件系统路径的概念。提供在网络中定位和查找数据的能力。

发布:发布可共享数据的元信息(如数据标题、数据用途描述等。)到区块链,哪能集德

同步:将数据元信息同步到基于区块链的数据共享平台,这是在链上收集的数据的集合。任何人都可以在这里查询并获取数据。

(2)数据需求方的获取过程

需求方获取数据,安排业务流程,开始数据共享。节点将根据流程的指示分配共享任务。同时,节点的虚拟机加载业务计算模型,并使用本地数据执行计算逻辑。

基于区块链+隐私计算技术的数据共享平台初探

检索:通过基于区块链的数据共享平台检索所需数据,包括数据的统一描述和链上的元数据信息,构建检索索引。

请求:请求相关数据的访问凭证令牌,并在平台中提供积分机制。根据数据发布方式,在请求数据时会进行积分转移和数据授权记录。当数据被授权访问时,需要向数据提供者发起数据访问申请,在数据提供者审核后获得智能合约颁发的令牌。

获取:数据请求方定制自己的业务流程和计算模型,按照流程流转给不同的机构,通过网络的节点ID和获取的令牌从提供方获取数据,基于区块链的数据共享平台点对点传输数据或计算结果。

用途:计算模型将使用授权获得的数据或积分购买的数据。通过加载模型,我们将使用自己的数据并计算结果。

总结

尽管区块链和隐私计算技术发展迅速,但相关应用仍然不足。目前数据流通的方式主要是原始数据传输的方式,数据隐私安全问题亟待解决。数据流通行业在业务发展、技术演进、政策和标准制定等方面发展迅速。为了实现数据价值的最大化,数据必须充分流通。传统的数据处理技术在隐私安全方面做得不够,一定程度上制约了数据流通。随着区块链、隐私计算、大数据等多方可信协作和数据处理技术的不断发展,以及国家政策法规和标准的不断完善,数据的安全共享和流通将逐步得到解决,数据的价值将逐步得到释放。

作者|高文军

视觉|王鹏宇

统筹|祖德光

转载自:中国光大银行科技创新实验室

微信二维码
售前客服二维码

文章均源于网络收集编辑侵删

提示:仅接受技术开发咨询!

郑重申明:资讯文章为网络收集整理,官方公告以外的资讯内容与本站无关!
NFT开发,NFT交易所开发,DAPP开发 Keywords: NFT开发 NFT交易所开发 DAPP开发