《隐私计算与区块链技术融合研究报告.docx》由会员分享,可在线阅读,更多相关《隐私计算与区块链技术融合研究报告.docx(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、隐私计算与区块链技术融合研究报告第一章 背景数据要素市场化已成为我国新一轮数字科技革命和产业变革的焦点。聚合多维海量数据,充分挖掘和利用其内在价值,是各个产业机构的战略重点。数据要素市场化发展的关键环节,在于能否打破数据孤岛,解决数据权属模糊问题,推动安全、可信的数据共享及价值流转,最大化挖掘数据的生产要素价值。近年来, 隐私计算和区块链技术逐渐成熟并快速普及,促进数据要素安全流通,为激活数 据要素市场流动性提供了安全可靠的解决方案。第一节 数据流通政策进展数据开放与流通是各国数字经济发展的核心要点数字经济在各产业领域带来的效率增长和产出增加已成为推动经济发展的 主引擎。近年来,各国密集出台相
2、应政策大力支持数字经济发展,核心都着眼于 更加安全的数据流通和开放。美国于 2018 年-2019 年先后发布了数据科学战略计划、美国国家网络战略和联邦数据战略与 2020 年行动计划等相关国家战略规划,明确提出促进数字经济发展的相关内容,以及将数据作为战略资源开发的目标,并通过建 立执行机制和管理体系确保数据开放落实。英国是政府数据开放共享程度较高的国家之一,具有较为完善的数据开放政策法规体系,推出了数字经济战略(2015-2018)、英国数字战略等战略计划,旨在通过数字化创新来驱动社会经济发展,并确立把英国建设成为数字化强国的方向。欧盟主要是在政策层面寻求各成员国的统一,以便利数据在欧盟内
3、部的流通, 并建立真正的欧洲单一数据市场。2020 年初欧盟发布了欧洲数据战略,年底 发布数据治理法、数据市场法、数据服务法等草案,体现了欧盟对内促进数据流通共享的一系列举措。另外,德国、日本、东南亚等国家也陆续推出了数据开放的相关战略规划, 以大力促进数据流通的发展。我国先后发布一系列鼓励数字经济的政策规划,并多次将数字经济写入政府工作报告。同时在“十四五规划”中提出,要发展数字经济,推进数字产业化和 产业数字化,推动数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。首次明确数据是一种生产要素。2020 年 4 月发布的关于构建更完善的要素市场化配置体质机制的意见中,明确提出要加
4、快培育数据要素市场,成为推动数据要素市场构建的重要指导。安全合规的数据流通是数据要素市场健康发展的前提随着数字经济的不断发展,由数据共享带来的数据滥用、盗用等不良现象层出不穷。相应的监管要求也在不断优化与加强,旨在营造公平公正、健康稳定的市场环境,完善数据的流通规则,确保数据安全有序被利用。欧盟于 2018 年出台了通用数据保护条例(GDPR),成为全球个人数据安全立法中极具标志性的一部法案。GDPR 赋予了数据主体同意权、访问权、更正权、被遗忘权、限制处理权、拒绝权及自动化自决权等规范数据权利。但也要 看到,欧盟在 2020 年发布的各项数据战略中,也深刻反思了 GDPR 带来高昂合 规成本
5、对数字经济带来的伤害和限制。美国各州对个人数据进行分散立法。被称为美国“最严厉、最全面的个人隐私保护法案”加利福尼亚消费者隐私法案(CCPA),规定了新的消费者权利,涉及企业收集的个人信息的访问、删除和共享,旨在加强消费者隐私权和数 据安全保护。但同严苛的 GDPR 不同,CCPA 针对个人数据利用问题显得更为开 放,更强调市场的自我调节。日本以专项保护法律为核心,同其他法律共同构成个人数据法律体系。日本 个人信息保护法就个人数据的正当处理,对其基本理念、政府制定的基本方 针以及其他个人信息保护措施的基本事项作出规定,对国家及地方公共团体的职 责等予以明确。我国在民法典、数据安全法、网络安全法
6、、数据保护法、 个人信息保护法(草案)中,以各种形式规定了数据使用合法合规的有关准 则和规范,安全的数据流通逐渐成各级政府和广大民众关注的重点。随着政策法规不断完善,数据野蛮使用和随意共享的时代已经落幕。要使数据要素在合法合规、保证各方权益的前提下有序流通,需要明确数据要素流通的价值,探索数据要素流通的可行模式,构建保障各方主体权益的规范性制度,对于加快培育数据 要素的流通配置体制有着重要的现实意义。第二节 隐私计算及区块链应用价值隐私计算及区块链是数据安全流通的关键技术数据安全流通需要制度和技术双管齐下,传统的数据共享手段难以适配跨 机构数据共享的旺盛需求和日趋严格的数据合规要求。多源异构的
7、大数据时代需 要更丰富、更安全、更具适用性的技术手段。如何打破数据孤岛桎梏、确保数据 安全有序被利用、实现数据价值最大化,是数字经济发展中亟待解决的问题。隐 私计算技术和区块链技术的融合为此提供了很好的解决方案。隐私计算是一套包含密码学、数据科学、人工智能、安全硬件等众多领域 交叉融合的跨学科技术体系,以保护数据全生命周期隐私安全为基础,实现对数据处于加密状态或非透明状态下的计算和分析,从而达到促进数据要素流通融合、 有效提取数据要素价值的目标。在保证各方原始数据安全隐私性的同时,完成对 多方数据的融合计算,实现多方数据的“可用不可见”。然而,数据的真实性、 数据来源、数据确权及流转过程是否安
8、全和合规是隐私计算技术面临的难点。同 时,由于多方数据质量参差不齐,数据所有者缺乏可信的激励机制、贡献评估和 利益分配流程,使得是隐私计算技术同时面临多方难互信、多方难协作等问题。区块链具有数据可溯源、难以篡改、公开透明、智能合约自动执行等技术 特点,是解决多方协作和多方信任问题的一把利器。通过共识机制在参与方之间 建立信任基础,实现点对点的价值传递。通过智能合约实现链上数据真实性验证 和审计。通过协同机制、激励机制的设置与共识,促进数据开放共享与价值协作。隐私计算与区块链都综合利用了密码学、分布式系统等技术,既有相似之处 又各有特点。通过将隐私计算和区块链相结合,不仅融合了二者的优势,也能解
9、 决双方技术面临的部分难点问题,实现“1+12”。既能在数据共享过程中有效 保护个人信息,实现数据的安全流通,还能为数据的真实性、数据确权等合规问 题提供可行解决方案,实现数据共享全流程可记录、可验证、可追溯、可审计, 并为进一步建设高效、高安全和高流动性的数据要素市场打下基础。第三节 隐私计算及区块链产业发展现状隐私计算及区块链技术为数据要素市场化进程提供新燃料截止 2021 年底,我国数据要素市场规模将达到 704 亿元,预计在“十四五”期间将突破 1749 亿元,总体上 进入高速发展阶段。在“十三五”期间,数据采集、数据清洗、 数据标注、数据决策等数据要素核心环节驱动数据要素市场规模快速
10、增长。伴随着各行各业数据价值沉淀和数据价值挖掘逐渐饱和,企业个体对 另类数据的饥渴态势逐渐显现。然而,当前企业数据泄露事件屡见不鲜,黑客 掮客非法获取并量贩个人信息,地下黑灰产对数据明码标价进行买卖,已形成规 模化市场。数据交易存在大量需求却“无技可施”,大量的数据供应方与数据需 求方之间缺少安全、透明、可控的交易桥梁,而隐私计算和区块链技术的融合 使得数据合规交易“有技可循”。近年来,数据交易市场再次升温,各大数据交易平台借助隐私计算、区块 链等手段,解决数据确权、数据资产化、数据定价等难点问题,推动多维度数据 有序流通融合,加快我国数据红利释放。截止 2021 年底,我国 数据交易市场规模
11、将达到 68 亿元,预计在“十四五”期间,数据交易市场规 模将达到 497 亿元。随着顶层设计 和配套设施逐渐完善,基于隐私计算与区块链等技术,具备合法资质的数据 交易平台可有效保护企业个体的隐私与权益,将是企业个体获取另类数据 的合规途径。隐私计算及区块链技术被初步运用并逐渐普及随着大数据生态的繁荣以及数据共创合作深入和细化,各机构之间的数据共 享、样本碰撞、联合建模需求越来越多,各行业纷纷探索隐私计算及区块链技术 应用,积极开展相关应用落地,希望能够提供安全的数据共创环境,促进并深化 政企协同、行业协同、区域协同力度。企业内部通过数据流通技术打通各业务线 “数据孤岛”,产业链条通过数据流通
12、技术打通上下游的“数据壁垒”,各垂直 领域通过数据流通技术打通行业间的“数据鸿沟”。2025 年将有一半的大型企业机构,在不受信 任的环境和多方数据分析用例中使用隐私计算处理数据,大数据生态的普惠性协 作将达到前所未有的水平。截止 2021 年 6 月,我国数据总量达 9ZB, 全国联盟链总节点数已达 36000,通过区块链技术进行流通的数据已达 80PB。 隐私计算节点数已达 4500,通过隐私计算技术进行流通的数据已达 2PB。目前 数据安全流通量不足数据总量的十万分之一,未来有广阔的数据蓝海有待探索。各行业应用落地百花齐放,区域化发展趋势凸显北上广浙苏依托自身人才与技术优势,大力发展数据
13、流通关键技术,围绕中 心经济地带的地域,结合自身特点发展相关业务应用。在应用 层面,隐私计算在互联网行业渗透率最快,金融、电信、医疗等行业渗透率提速 攀升。区块链在政务、供应链、金融等领域得到逐步普及,应用落地多向开花, 其他行业渗透率稳定攀升。在全球抗击新冠疫情的战役中,隐私计算及区块链技 术在联合诊断、医疗信息共享、冷链溯源、公益捐赠管理、个人身份管理、打击 假新闻等方面发挥重要作用,为政府部门提供切实的解决方案。区块链厂商抢先布局隐私计算,助力数据价值流通近两年,隐私计算产业迸发式增长,互联网巨头、数据服务商、初创企业、 金融机构、运营商纷纷加入隐私计算赛道。目前国内 56 项隐私计算产
14、品,其中 21 项出自区块链背景企业。由于隐私计算与区块链技术形成了天然的互补以及两者产品形态同源异流,区块链企业凭借长期技术积淀和切身业务诉求驱动,率先探索隐私计算产品研发与应用。行业共识逐渐凝聚,标准制定稳步推进随着隐私计算和区块链技术的兴起,国内对于两项技术的标准化研究也在 快速发展中。隐私计算相关标准主要集 中在对各类技术的整体框架、调度管理、数据处理、功能描述、算法实现和安全 要求等方面进行统一的规划梳理。区块链相关标准旨在围绕区块链技术的概念、 技术和应用三个维度,提升不同平台的一致性和互操作性,基于建立行业共识的 基础上为构建整体的区块链生态提供规范的基础资源框架。国外开源项目逐
15、年增多,国内开源生态仍有待培育随着区块链行业的不断发展,国外开源项目数量持续增多,不断推进开源生态进步,开源项目数量呈现逐年增加的趋势。其中可信执行环境是 联盟链开源项目的主要研究方向,零知识证明是公有链开源项目的主要研究方向。 我国开源项目起步时间明显晚于国外,但国内开源意愿 不强烈,项目活跃度与国外开源项目有较大差距。第四节 隐私计算及区块链技术发展现状各研究方向逐步明晰,鲁棒性、通用性和扩展性快速提升在过去 20 年,多方安全计算和同态加密的性能提升了 3-7 个数量级。随着实际生产中对隐私计算的需求快速增加,学界、业界等各方积极研究通信效率更高、计算速度更快的安全协议。随着软硬件技术不
16、断突破和算法不断优化,同态 加密、多方安全计算、零知识证明等关键技术的门槛会越来越低,支持的复杂运 算任务将会越来越多,灵活易用、多元化、通用的隐私计算产品将会是大势所趋。 2020 年、2021 年参与中国信通院可信区块 链测评一共 46 项区块链产品,其中具备隐私保护能力的产品占 71%,国密算法 支持率达 78%。区块链支持的隐私保护手段逐渐多样化,以传统加密、同态加密、 权限控制为主,可信执行环境、多方安全计算和零知识证明均有产品尝试。专利数量迅速增长,通用隐私计算是区块链领域的研发重点全球区块链结合隐私增强技术的相关专利申请起步于 2014 年,我国在该领域的专利申请起步于 2016
17、 年,随后在 2018 年起呈现爆发式增长,申请人数量和申请量几乎成正比增长,呈现典型的新兴技术萌芽发展态势。在 区块链隐私保护的技术体系中,全球技术研究布局始于身份隐私、计算隐私和硬 件隔离,逐渐向多元化路线发展。2017-2019 年期间,研究重点是区块链参与者 身份和交易金额的隐私保护,随后研究方向逐渐从单一隐私保护算法向混合的、 通用的隐私计算技术发展。其中安全联合建模和数据授权计算是近期的研发重点, 具有较大发展潜力。高效的全同态加密方案一直是隐私计算的重点课题从同态加密(Homomorphic Encryption,HE)的概念提出开始,经历了早期的 半同态方案、类同态方案之后,高
18、效的全同态加密方案一直是该领域的重点发展 方向。部分同态算法和类同态加密效率更优,但仅支持单一运算类型的、有限次 的密文运算,可应用的场景和产品较为局限。全同态加密算法理论上可支持无限 次任意运算和运算组合,但由于其基础理论复杂度较高,实际使用时存在效率低, 密文存储空间占用大的问题。多方安全计算逐渐从简单计算向复杂应用转移,成熟通用框架初现多方安全计算(Multi-Party Computation,MPC)最初的研究起点是针对集合求交、布尔运算、算术运算、匿踪查询等比较简单的安全计算场景,主要基于两 条发展路径:一条秘密共享,一条混淆电路。在基于秘密共享的发展路径上,预 计算阶段的性能随着
19、新的密码学工具得到了较大的提升,算子算法也逐渐形成计算框架。混淆电路则更多聚焦于更强大的敌手能力模型下的安全计算场景。从学术论文的角度看,近年来,恶意安全模型下的 MPC 协议研究比例在增加,复杂 计算的研究比例在增多。此外,近年由于数据联合建模方面的需求逐渐增多,也促进了基于 MPC 的机器学习算法的研究,将多方安全计算技术拓宽到更广义范畴,使得 MPC 更具有可落地的应用性。在区块链系统中,MPC 主要被运用在密 钥管理、身份认证、共识机制等环节中,以提升区块链系统的安全性的隐私性。零知识证明是近年来区块链领域的研究热点零知识证明被应用在区块链系统中,主要体现在可验证计算、身份认证、分 布
20、式存储、共识机制、计算压缩与扩容等方面。其中递归零知识证明(Recursive SNARKS)、凯特承诺(Kate Commitment)和可信设置移除是近期区块链结合零 知识证明的研究热点。通过递归零知识证明可以压缩区块链账本的大小,从而减 小存储开销和通讯开销,提高区块链网络的性能。通过移除可信设置可以将区块 链和隐私计算网络的信任根去中心化,从而提高网络的安全性和鲁棒性。可信执行环境是当下通用隐私计算最高效的解决方案在区块链系统中,可信执行环境主要用于机密交易、机密计算、共识机制和 跨链等方面。通过将虚拟机或执行引擎置于可信执行环境内便可构建通用的可信 计算框架。通用的可信计算框架依托于
21、区块链带来的公开透明,通过将可信执行 环境的信任根、代码度量、计算行为在链上公开验证,可构建区块链和可信执行 环境的信任闭环。第二章 核心挑战与融合价值隐私计算和区块链均是密码学发展的产物。在区块链中,密码学的运用是为 了验证和协作,在隐私计算中则是为了安全和隐私。隐私计算虽然实现了在多方 协作计算过程中对于输入数据的隐私保护,但原始数据、计算过程和结果均面临 着可验证性问题。区块链凭借分布式、公开透明和不可篡改的特性,可有效构建 信任协作网络,完美契合数据确认、有序流通、透明监管的需求。区块链与隐私 计算的有机结合,使原始数据在无需出域与归集的情况下,可实现多节点间的可 信协同计算和数据隐私
22、保护。同时,能够解决大数据模式下存在的数据过度采集、 数据隐私保护,以及数据储存单点泄露等问题。区块链确保计算过程和数据可信, 隐私计算实现数据可用而不可见,两者相互结合,相辅相成,实现更广泛的数据 协同。第一节 数据流通面临的挑战数据流通仍有诸多问题亟待解决第一,由于数据要素可被轻易复制的特殊属性,数据的拥有方不放心让自己 的数据进入流通环节,企业担心数据在流通过程中可能造成商业机密的泄露,个 人担心数据在流通过程中可能会造成隐私泄露的侵害。第二,由于数据要素难以 确权定价,数据流通难以规范化和市场化,当前的数据流通存在黑市交易、无序 流动、数据孤岛等现象,数据价值无法充分释放。第三,由于各
23、方数据质量参差 不齐,使得多方数据共享后的价值大打折扣,组织间难以协作联动,阻碍数据共 享。第四,由于数据流通技术的隐私和安全能力难以量化评估,数据流通服务多 以黑箱形式示人,难以自证安全,需求方难以分辨优胜劣汰,阻碍产业健康发展。 第五,数据流通服务的准确性、真实性与服务稳定性难以保障,给数据的使用者 带来安全和业务隐患。第六,随着数据融合应用的深度不断深化,标准化的数据 流通产品无法满足数据需求方的深度融合与利用诉求。针对个性化的模型和策略 共创需求,缺乏保护数据源数据与需求方商业秘密的两全方案。仅靠单一技术难以构建高效、高流动性的可信数据共享网络任何单独技术都有一定的使用范围,只有从单一
24、技术走向融合技术,才能满足数据安全流通的多种需求。要让数据充分流动起来、更高效地互通共享产生更 大价值,有必要打造开放的、多元化的、多层次的数据共享网络,吸引不同需求、 不同偏好的数据持有者参与进来,并进行高效的可信协作,形成网络效应。不过, 打造数据共享网络还有一系列问题需要解决,比如数据可信溯源、数据安全审计、 数据权属界定等问题,这些问题仅靠单一技术难以解决,还需要多元化的解决方 案。第二节 隐私计算技术面临的挑战数据共享流程缺乏安全性校验,参与者身份及数据缺乏记录和验证隐私计算主要是解决了计算环节的数据隐私保护问题,但站在数据共享流通 的全链条来看,参与者身份是否真实、是否有主观作恶风
25、险、数据内容是否完整 可信等问题都会带来数据隐私和可用性的风险。以联邦学习为例,参与联邦学习 的客户端很多,他们可以利用模型参数和训练数据实施攻击。另外,由于中央服 务器负责聚合数据、客户端选择和全局模型维护,因此中央服务器可能会被攻击 者所利用。数据共享参与者缺乏合理的激励机制和公平的协作环境隐私计算是多方之间联合产生共同成果,然而各机构业务发展水平不同、数 据质量参差不齐、特征分布不尽相同、成果贡献缺乏合理的评估和利益分配机制。 拥有高质量数据样本的数据源对共同成果的贡献更大,如果没有合理的贡献度价 值衡量机制,就难以激励数据所有者与其他数据源进行合作,不利于数据共享。 在复杂的多边关系场
26、景下,如果信任成本太高、合作摩擦系数太大,将导致多方 协作无法建立,难以达成规模效应。第三节 区块链技术面临的挑战链上账本数据公开可见,无法满足多元化的数据隐私保护要求从本质上来说,区块链是一个分布式账本系统,需要不同节点对交易以及状 态进行验证来达成共识,这要求链上数据都是公开共享。虽然数据的透明度提高 了,却带来了数据的隐私问题。区块链中部分数据提供方可能并不希望自己的数 据全部公开,比如交易身份、金额、合约等比较敏感的数据,这不仅包括个人交 易隐私,还包括应用场景中各种业务数据。因此,为在更广阔的领域使用区块链 技术,需要解决链上数据的隐私保护问题。此外,虽然区块链可以解决链上数据 的正
27、确性问题,如数据上链后不能篡改、可追溯等,但如何保证数据存入区块链 之前的真实性和可靠性仍存在挑战。链上数据处理能力不足,制约了区块链进一步拓展应用场景链上计算受限于虚拟机执行和网络共识性能,导致了链上无法承载大量交 易和无法即时交付等问题,然而很多时候区块链应用需要支持高吞吐的交易量 和即时交付的能力。具体来看,首先区块链智能合约的计算能力亟待扩展。随 着区块链业务场景的复杂度增加,仅通过区块链链上智能合约实现的逻辑极为 有限,急需在保证数据隐私安全的前提下扩展链上的计算能力。其次,缺乏链 上链下协同、可支持多种业务验证需求的可信执行环境。将链上计算任务外包 给链下执行,需要连接链上链下数据
28、的可信通道;为保证链上数据的真实性, 需结合链下数据进行融合计算,需要链下执行计算的可信环境。第四节 隐私计算与区块链融合带来的优势基于区块链和隐私计算的身份及密钥管理能力可应用到平台、网络和节点的 安全加固方面,同时也为链上数据提供了增强版安全服务,实现数据合作参与方 的进一步增信,为高要求的行业应用提供更安全的技术支撑。从技术角度看,基 于区块链隐私计算实现的密钥分发功能,可降低密钥中心化存储的安全风险,体 现出密钥分片存储的价值。基于区块链隐私计算实现的密钥协商功能,通过区块 链公开传输密钥材料并进行身份核验,可防止中间人攻击和丢包攻击。基于区块 链隐私计算实现的多重签名及组装验签功能,
29、各参与方使用自身私钥和群签名完 成签名并将签名分片发送给组织方,同时组织方根据收到的全部签名分片计算得 到最终的多重签名并可根据群公钥验证其有效性,从而增强数据协作的安全性和 效率,体现出分布式签名的价值。基于区块链隐私计算实现的分布式身份和可验 证声明功能,可使数据资产标准化并授权可控,结合数字签名和零知识证明等技 术,可以使得声明更加安全可信,为进一步的精细化权限管控提供基础工具。解决数据共享参与者身份及数据可信问题参与者身份不可靠或者存在主观作恶意图,就可能会在隐私计算过程中合 谋推导出其他参与者的隐私数据,或者在计算过程中提供假数据参与计算,造 成非预期的计算结果,极大影响数据共享挖掘
30、出的数据价值。应用隐私计算和 区块链技术,一是提升隐私计算的活动监测和监管审计能力。可以通过技术手 段和共识机制对参与共享计算的关键数据进行链上共享和真实性交叉验证,同 时亦可以对参与方的数据操作进行溯源,使得数据共享过程具有可追溯性;二 是提升恶意参与者的作恶成本。通过分布式数字身份,可以实现对参与方的数 字身份管理,通过签名算法确保参与方的真实可信,避免参与方的仿冒。参与 者的行为记录如数据写入、计算结果传递等都可记录在链上,永久存储并不可 篡改;三是提升参与共享计算的数据质量。通过区块链记录数据共享过程中各 参与方的行为,引入数据质量评价体系,从而反向推动实现安全、可信的数据 共享计算。
31、通过智能合约对客户端 上传的局部梯度进行异常识别并抛弃那些可疑的数据。另外,在多方安全计算 中,通过区块链来记录和共享关键中间参数,核验各方在计算流程中是否有作 恶行为,以此来保证计算流程的安全性。增强区块链的隐私保护能力区块链的隐私保护方案可以分为以下三大类:混淆方案(Obfuscation)、 隔离方案(Isolation)和密码学方案(Cryptographic)。其中链上交易机密 性、不可链接性和不可追踪性是密码学方案的主要目标。通过在区块链系统中 引入用于隐私保护的密码学算法,比如同态加密、环签名、零知识证明等隐私 增强技术,在链上直接解决数据隐私保护问题。比较常见的方案是在原有区块
32、 链的账户模型上进行拓展,附加一层隐私交易方案,以此来保护账户和交易信 息的隐私。近些年,区块链的隐私保护能力已经从匿名账户和机密交易拓展到 通用的隐私计算,在数据结构、共识机制、虚拟机等层面引入隐私增强技术均 有相应的方案尝试。目前,半同态加密是区块链链上数据隐私保护的主要手段。上链的数据可通 过调用 Paillier 半同态加密库对明文数据进行加密,链上的密文数据可通过调用 Paillier 预编译合约实现密文的同态加运算,密文返还回业务层后,可通过调用 Paillier 库完成解密,得到执行结果。扩展数据安全流通纵深体系链下计算作为区块链扩展方案之一被广泛采用。链下计算的基本思路是将原本
33、置于链上处理的各类事务,外包给链下处理,而链上仅保留验 证的部分,以此间接提升区块链的数据处理和隐私保护能力。通过扩展链下计算 网络,区块链专注业务逻辑可信执行与数据权属凭证流通,而链下隐私计算网络 则负责大规模运算和数据价值流通。近些年,以零知识证明技术为主的公链链下 计算方案层出不穷,主要是通过将链下数据处理过程压缩成一个可验证的证据包 置于链上,以减少链上的计算规模和成本。不过应用过程中仍难以平衡好安全性、 隐私性和性能,会带来较为严重的性能损失,无法支持大规模的计算场景。目前 一种比较好的解决方案是结合可信执行环境来解决。可信执行环境起到了硬件中 的黑箱作用,在可信执行环境中执行的代码
34、和数据操作系统层都无法偷窥,只有 代码中预先定义的接口才能对其进行操作。于是结合可信执行环境可以把区块链 隐私问题转化为权限控制问题。在应用中,用户可以通过软件层权限定义来设计 各种模型的隐私保护需求;在效率方面,由于可信执行环境的黑箱性质,在可信 执行环境中进行运算的是明文数据,而不是同态加密中的复杂密码学运算,计算 过程中效率没有过多损耗,因此,与可信执行环境结合可以在性能损失较小的前 提下在很大程度上提升区块链的数据处理和隐私保护能力。构建全程闭环的数据生命周期安全管理数据生命周期全流程管理包括数据采集、传输、存储、使用、流通、销毁等 环节。隐私计算结合区块链技术可以应用到数据流通全流程
35、各环节当中,包括数 据生成及采集合法性验证、数据处理存证和共识、数据使用授权、数据可信流转、 数据安全加工和协作、以及数据管理审计等,实现全程闭环的数据安全和隐私服 务,操作和处理记录可上链保存、不可被篡改。数据共享计算参与者可以在链上用智能合约来实现计算过程中的协作管理 功能,由参与方之间共同治理隐私计算过程,协作过程公平公正、公开透明、权 责对等,避免了中心化协调方参与带来的隐私泄漏的风险;另一方面,数据持有 者可将共享数据目录、数据使用申请、数据使用审批、数据使用审计等功能上链, 链上参与方可以对其他参与方的数据资源一目了然,计算过程的数据使用情况可 以存证留痕,确保参与方按照约定的方式
36、进行计算,提升数据共享协作效率。可 通过多方签名确认的方式记录数据的关键状态,进一步提高数据可信度,同时可 通过对哈希值的验证匹配,实现信息篡改的快速识别。基于链上数据的记录与认 证,可通过智能合约,实现按照唯一标识对链上相关数据进行关联,提升数据的 可追溯性。培育共享共生的数据要素市场生态数据要素市场化的前提条件是成熟的数据确权机制和稳定的数据流动性。 权属界定不清、要素流转无序、定价机制缺失、安全保护不足等问题一直是掣 肘数据要素高效配置的“痛点”。只有保障数据资源的价值、解决数据权属关 系边界模糊的问题,让数据主权真正的回归到每一家机构和每一个个人,才能 使数据具备权利属性,进而设定为资
37、产。首先,结合区块链技术,可使用数据 标签、数据指纹、分布式身份等方式先为数据资产生成唯一标识符,然后在链 上与数据持有者的数字身份进行关联,实现数据持有者对数据资产权益的公开 确权。其次,基于区块链构建的可信协作关系,各参与方可进一步共创数据价 值流转和分配机制,让数据资产交易的公平透明度提升,激励参与方积极贡献 数据、模型或算力。再次,隐私计算可以把数据使用价值精确限制到具体算法 和使用次数,实现用途可控可计量。数据所有者通过签名算法声明数据的所有 权,通过加密算法规定数据的使用权。数据交易市场可以从数据持有者处收集 数据,然后为数据消费者提供隐私计算服务。数据消费者提供一个特定的计算 任
38、务,其输入是其指定数据在特定算法下的一次使用权,而输出是数据消费者 想要的结果。这样,数据的所有权和使用权进行了分离,并且可以使数据资产 价值以市场化的方式计量,从而进一步促成数据交易市场的定价机制。第三章 典型解决方案区块链技术的应用场景可以分为三个阶段:链上存证、多方协作和价值转移, 其中隐私计算是区块链发展到第三阶段必不可少的技术工具。目前,隐私计算和 区块链技术仍在不断地发展迭代和快速应用中。本部分将结合着具体的场景,简要介绍当前隐私 计算结合区块链的一些典型应用解决方案。第一节 用于机构间联合风控风控是金融领域的核心业务。金融机构出于数据安全及商业保密性的考虑,各家数据往往互相割裂,
39、自建高墙,缺乏 信任,不愿进行数据共享,导致用户风控指标精准度低。一方面,优质的中小企 业缺少多维度一手数据的佐证,难以自证背景真实性及还款能力;另一方面,金 融机构也难以依据零散、缺失的数据对企业进行精准信用评估,最终导致银行风 控难、放款成本高,中小企业面临融资难、融资贵的困境。隐私计算结合区块链技术在金融风控场景具有巨大的潜力,各机构对数据进 行加密上链,利用区块链所提供的数据与业务不可篡改、合约自动化执行的特点, 确保数据可追溯可验证以便于监管审计,提高违约成本和机构公信力,保障数据 的合法合规使用;各方的多维数据可在隐私计算的保障下,安全合规的多次开放 共享进行联合模型训练,提高风控
40、模型的精准度。以金融机构间联合风控场景中贷款机构或个人信用联合查询业务为例,业务流程如下:贷前审核。中小企业申请贷款后,银行在不暴露客户隐私、不暴露查询 ID 的 前提下利用智能合约向联盟发起多方匿踪查询申请,联盟利用智能合约首先 验证银行身份、抵押令牌等信息;贷中监控。身份验证通过后,一方请求多方响应,联盟内启动联合计算。由 联盟内各参与方联合查询和安全计算该贷款申请方的贷款记录、黑名单历史 等信息,并进行多方比对核验,最后将加密结果告知查询发起方银行。每次 查询发起信息和查询结果在联盟各参与方间存证。银行参考查询结果对贷款 申请进办理,期间所有数据流转和结果计算日志都进行上链存证,便于后续
41、 追溯该笔贷款交易;贷后跟踪。联盟上各参与方共同维护风险名单,智能合约对风险进行实时告警。每次交易后在各节点进行账户通证结算,对查询数据提供方和查询发起方实行激励机制和支付机制,鼓励联盟内各节点积极参与到查询结果的计算 和校验。第二节 用于机构间联合营销传统联合营销主要有两种模式,一种模式是不涉及到数据融合,按照约定的规则,给相应用户发放权益;另一种模式是涉及到数据融合,各方都把自己的数据准备好,放在同一个安全的服务器上,然后在安全服务器上进行数据融合建模,把融合的结果进行营销投放。从合作模式来看,因为合作方担心数据泄露,要么不做数据融合,直接广泛投放,要么非敏感数据集中式融合,所以 传统的联
42、合营销还未实现精准化营销。基于隐私计算及区块链技术,可以帮助联合营销各方在数据安全的情况 下,进行深度的数据融合。联合营销各方都是对等,通过在各个安全节点,让各方数据进行安全融合,原始数据都不出库,实现数据可用不可见,计算在数据源端,这样就可以基于多方用户特征数据建立用户分层模型,进行分层营销,每类用户权益不一样,在控制成本的同时,提升转化率、降低打扰率、实现精准化营销。基于隐私计算及区块链技术可以保证企业在挖掘用户数据、构建用户画像 时安全合规。第一,所有用户个人数据相关的服务调用都必须获得用户的明确授权,借助区块链技术,授权及授权撤销均可以达到交易级的细粒度。所有数据查询和授权记录具备可追
43、溯,无法篡改的特性。第二,所有涉及个人的明细数据和 加工特征不会输出,仅将模型或策略的结果输出和共享,保证数据最小化利用。 第三,在数据共创环节,所有个人用户的 ID 均会通过 HASH 散列方式处理,样本数据在交换之前经过匿名性检查,所有计算均在加密或脱敏之后的数据之上进行,最大程度的保障个人隐私数据安全。第四,采用区块链及隐私计算多层级的 分布式架构还提供了额外的安全性,数据不会集中于任何中心节点,具备更强容 灾与防攻击能力,杜绝了任意节点被攻破全盘皆输的风险。联合计算公开可控。在客户授权后,营销机构在链上发起联合查询任务,提升跨机构协作的公开透明度。多方安全计算平台赋能机构对潜在客户多维
44、度信息进行分析,从而更精准的投放广告。广告投放机构可以从更多数据维度 对客户购买意向建模,触达客户的整体画像;数据可用不可见。数据合作各方通过本地安装的隐私计算节点完成联合查询 或联合建模任务,可保证原始数据不出域,仅输出计算结果;问责和激励机制。数据共享计算后,联合营销参与方将每次查询的请求以及原始数据的 SHA 指纹存证到区块链,保证查询记录及数据真实可追溯。当用户对数据的正确性有疑问时,参与方可以从区块链上进行数据正确性验证, 保证查询过程中各方提供的数据真实可信;同时也提供了参与各方的贡献证 明,帮助在机构之间进行利益分配。第三节 用于机构间联合数据运营多方安全计算技术与区块链技术的深
45、度融合,可以在跨机构联合运营场景 内实现客户消费行为数据的联合统计,在保护平台商户数据隐私的前提下,提供 了联合运营的解决方案,基于多个运营商数据联合开展客户运营,可达成多场景交易数据的联合计算,让数据联合运营产生价值。同时商户可根据业务规则自行 定制数据脚本,可以在不增加数据运营人力的基础上,为平台客户指数级增长提 供技术支持,有效解决数据服务成本高的问题。在运营商户联合计算场景中,商户本地部署区块链节点和 BaaS 工作台,用 户在工作台上可实现联合计算商户对象的选择、场景数据的申请和授权,计算算法的发布及计算任务的配置,场景数据计算过程中的计算算法、计算数据及授权等数据操作在各方达成共识
46、后存证区块链,实现数据的隐私计算及计算过程的审 计追溯。本地部署区块链节点和 BaaS 工作台:运营商户通过工作台,用户可实现联 合计算商户对象的选择、场景数据的申请和授权等操作;发布联合安全统计计算的算法:联合运营商户将业务逻辑转化成智能合约,在平台进行发布;配置安全联合统计计算任务:联合运营商户根据自己的实际业务场景需求, 创建多方安全计算任务并进行配置;运营商户发起查询:运营商户在界面发起查询请求,启动多方安全计算任务, 反馈基于多方的安全统计计算结果;计算的可追溯:计算过程中的计算算法、计算数据及授权等数据操作存证于 区块链,在审计监管角色下实现数据计算过程的审计追溯。新运营模式主要体
47、现如下亮点商户资源价值提升,支持新的商业模式。在保护平台商户数据隐私的前提下, 提供了联合运营解决方案,让多机构联合开展客户运营,各商户的流量、数据等 资源均可通过联合运营实现商业变现,支持新的商业模式。提升客户体验,实现拓客和活客。在开放生态中,客户在任何服务场景中的消费行为均可被生态内其他场景所认同,并且跨场景的用户行为认同延时从 T+2 日缩短至准实时,可真正实现以“客户为中心”的消费金融服务。降低运营成本,支持多机构生态共建。数据中台通常采用“中心化运营”, 即相关数据查询服务须由服务提供商统一定制开发,这种方式在支持开放生态的 数据运营时力不从心,其在数据运营的技术支撑投入无法随着生
48、态数据维度、参 与方数量的增长不断增加,需要一种新的模式有效支撑不断增多的数据运营需求。 在区块链中,所有的数据查询脚本均由运营商自行定制并共识发布,可以在不增 加运营人力的基础上,解决数据服务成本不断升高的问题。区块链全程追溯,填补多方安全计算空白。在计算过程中,多方安全计算服 务与区块链交互,区块链实现计算生命周期下的数据、操作、计算过程及结果的 全程可追溯、防作弊,满足安全计算及审计监管等要求。第四节 用于可信协作与跨链取证存证是目前大量落地推广的区块链场景。区块链通过存证业务汇聚并沉淀 多方数据的同时,也形成新的数据孤岛。跨链技术(Cross-Chain)可使各个链之 间进行不同程度的互操作。通过应用层跨链,很难保证信息的真实性,同时应用 层适配异构链的改造成本也很高,如何能够低成本地进行信息可信跨链传递,成 为迫切需要解决的问题。在司