数字时代的数据和隐私.docx

上传人:太** 文档编号:62515998 上传时间:2022-11-22 格式:DOCX 页数:75 大小:1.85MB
返回 下载 相关 举报
数字时代的数据和隐私.docx_第1页
第1页 / 共75页
数字时代的数据和隐私.docx_第2页
第2页 / 共75页
点击查看更多>>
资源描述

《数字时代的数据和隐私.docx》由会员分享,可在线阅读,更多相关《数字时代的数据和隐私.docx(75页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、提取有用洞察,却不会暴露或回溯至原始数据。区块链技术也可以通过对个人数据进行 加密和密钥,降低隐私风险。这些技术的目的,是让服务提供方进行大数据分析时,懂 得客户特性和需求,然而却“不知道客户是谁”“数据可用不可见”,从而更好地满足客 户和数据相关的两个权益。另一方面,隐私工程和隐私技术本钱不菲,给初创公司和中 小企业带来更多挑战。在多大程度上做好,能够同时满足消费者和生产者的需求,从而 发挥数据作为生产要素的价值,同样是值得整个社会讨论的问题。长期来说,食品平安以及飞行服务等行业的历史经验说明,假以时日,合理的机制 设计和不断完善的技术,可以在很大程度上缓解数据隐私和平安问题。就像吃很多东西

2、 不见得会中毒,频繁乘坐飞机不见得会出事,数据提供的体量和隐私及数据平安并不是 必须的取舍。当技术足够强大,机制足够合理,今天看起来严重的隐私风险即便无法彻 底杜绝,也可以得到有效控制。如何从数据的本质看数据的权属、利益分配和保护责任问题?我们在报告第五章中提出了一个数字时代理解数据和隐私本质问题的综合框架,也称 为“数据权衡框架”。数据的问题需要综合视角去理解,否那么很容易陷入“盲人摸象”的 困局。首先,数据具有和物理商品截然不同的本质属性,在生产和使用过程中牵涉到多方。 其次,我们需要综合考虑用户和数据相关的两个福利,即隐私保护权益和因为提供数据而 获得服务的权益。再次,数据提供在经济活动

3、和人类协同中必不可少,数据只有通过在社 会和经济行为中流动才能创造价值。这个数据权衡框架包含数据的两个本质特征、三个视角,以及一个基本原那么。1 .数据的2个本质特征:非竞争性和不可别离性。首先,数据和物理商品不同,据 有非竞争性,可以被无数次生产和使用,而不会消耗数据相关的对象。其次,不管数据 的使用者是谁,都可能对数据相关的主体带来潜在影响;数据使用和数据主体存在不可 别离性。2 .数据生产和使用的三个视角:数据生产者 数据主体和使用场景。这里数据生产 者(在商业环境下)是指观察、收集和处理数据的机构和个体。数据主体是指数据描述的 个体(个人数据)或对象(非个人数据)。使用场景是指使用数据

4、的经济或社会活动。数据需要被观察才能产生,所以数据相关主体并不一定是数据的生产者。基于数据 的两个本质特征,数据生产者和数据主体的利益是相互关联的。从数据生产者的角度来说,要产生数据,既需要数据主体,也离不开数据生产者, 并且数据的使用也会同时影响两者。数据的非竞争性本质决定了,数据可以有无数个所有 者,而不会消耗数据或者数据主体本身。举例来说,一个人发表演讲的数据是由每一个听 众分别产生的,并且会因为每个听众的视力、听力和关注点不同而有所差异。基于数据形 成的信息也可以提供给不在场的人,而不会损耗演讲者。从数据主体的角度出发,使用数据会对他们造成影响,因此他们的权益必须得到保 护。从使用场景

5、的角度看,数据不应被简单地类比为一种有固定价值的商品。在实践中, 数据需要归集、存储、分析,形成对场景需求有价值的信息洞见。一方面,这个过程需 要消耗本钱和能力。另一方面,数据的价值是变动的,取决于基于数据的信息能在多大 程度上提高经济和社会活动中交互的效率。所以,数据的使用是经济活动中不可别离的 局部,其价值也随着具体的场景需求而变化。数据的两个本质特征,和数据生产者、数据相关主体、使用场景三个视角,可以帮 助我们理解数据和其他商品或生产要素有什么不同,数据是如何产生、如何发挥价值的, 以及牵涉到的相关方。基于这个权衡框架,我们可以得出三个结论:首先,将数据等同于 一般商品那样拥有唯一所有权

6、的观点是不合理的。第二,隐私保护的重点应该是在数据 使用中尊重和保护数据主体的隐私权,而不是将数据独有权给予数据相关主体,否那么难 以发挥数据作为生产要素的价值,最终让所有的相关方受损。最后,数据生产者和数据 相关主体之间应在平等自愿的基础上达成协议,从而双方都可以从数据的生产和使用 中受益。总结起来,数据治理的核心原那么应该是在促进数据流动的同时保护数据主体的权 利。1.3. 数据治理问题1.3.1 数据治理的演进逻辑我们在报告的第六章讨论数据治理的几个核心问题。我们的数据权衡框架有助于更好地理解数据隐私监管和治理的演进。上世纪70年代, 美国公布了公平信息实践(FIPS),为现代隐私保护的

7、治理法规和监管奠定了基础。实践基于五大原那么包括:(1)通知/知情;(2)选择/许可;(3)接入/参与;(4)完整 /平安;以及(5)执行/纠正(美国联邦交易委员会,1998)。这5大原那么指导美国联邦委员会“鼓励和推动有效的自我监管,作为保护消费者线上 隐私的主要方式”(FTC, 1998),进而成为后来隐私和数据治理条文和法规的原型, 包括欧盟的数据保护原那么指令(DPPD)、通用数据保护条例(GDPR)以及美国 的加利福尼亚消费者隐私法案(CCPA)。以FIPs为基础演化而来的个人数据治理 法规有一个父键的共识,那就是不要将数据锁入保险箱里或拘泥于数据所有权,而 是鼓励平安的数据流动,同

8、时保护消费者隐私。例如,经合组织(OECD)就提出“兼 顾平衡的隐私立法,并保护相关人权同时防止干扰数据的流动”。让消费者从 提供个人数据中受益,这个定位和我们的数据权衡框架中确立的基本原那么是一致的。虽然在大原那么上一致,但在数据使用上有不同程度的限制,反映出不同国家和机 构对数据治理的实践差异。诺奖得主Elinor Ostrom指出,尽管动机良好,但过于严厉 的治理政策会对专利、知识产权、授权、定价甚至“数字经济的存续”带来不利影响。 她认为,政策制定应让各参与方都成为利益相关方,从数据提供中受益(Layton, 2019)0很多其他学者也得出了相似的发现和结论(Goldfarb and

9、Tucker, 2011; Martin and Murphy, 2016)。“任何条例都会带来应用的本钱,数据隐私法可能会限制珍贵的信息流动,带来隐私和平安风险,提高市场进入障碍,增加创业者的不确定性,以及催生 寻租行为(Layton, 2019)01.3.2 数据和竞争的关系数据驱动的商业行为在竞争中会扮演越来越重要的角色,因此我们需要理解数据驱 动的市场行为会如何影响竞争。竞争法的核心目标是:“确保消费者可以从竞争的力量 中受益(Shapiro, 2018)0要判断竞争是否被扭曲,消费者的利益是否受损,我们要用 事实说话,深入理解行业结构、企业的商业行为,并评估其市场表现。我们先回顾一下

10、交易对竞争以及国家的企业竞争力的正面影响。如上文所述,在中 国,线上市场的出现让买卖双方的平均距离从10公里上升至1000公里。在1776年出 版的国富论中,亚当斯密指出,垄断力量是“良好管理的大敌”,而交易范围的扩 展会打破这种垄断:七犬况良好的公路、运河、船只往来的河流,这些大大降低了货运的开支,将一国 偏远的地方与城镇周边置于同一开展水平上。它们都得到了最好的交通改善。这将刺激 遥远地区一国最偏远一环的开展。通过打破本地商人的垄断,对城镇的开展多有裨 益,也对国家的其他地区有益。尽管交易扩张在旧市场中引入竞争性的商品,但也为旧 产品带来了新的市场。此外,垄断是良好管理的大敌。只有在自由和

11、全面的竞争下,市 场中的每个人为了自我防御都要遵循规那么,好的管理制度才能建立起来如同亚当斯密时代的“公路和运河”延伸了贸易距离,打破了垄断,提升了偏远 地区商家的竞争,21世纪出现的平台数字网络也打破了本地垄断力量,并且如下文所 述,建立了一个更健全、更具竞争性的商业环境,只不过两者的速度和效率无法同日而 语。另一方面,数字经济中可能阻碍竞争的商业行为在全球范围内正在引起越来越多的关 注和争议。由于篇幅所限,本报告无法为所有相关问题提供答案,我们基于初步证据,聚 焦于讨论三个和数据竞争相关的关键问题。首先,企业在多大程度上利用大数据技术歧视性对待消费者?商家今天获得关于客户的信息前所未有,无

12、论数据量还是数据种类都远超前人想象。 从理论上讲,企业通过数据更懂消费者,是有可能成体系地对消费者采取价格歧视,攫取 消费者利益。在实践中,我们也会在不同国家看到“大数据杀熟”的个别案例。但总体而 言,和蓬勃开展的大数据运用相比,大数据杀熟的案例要少得多。也没有任何国家的研究 发现大数据杀熟的广泛现象,反而免费、普惠成为更加普遍的时代特征。这是为什么呢?一个可能的解释是,数字技术改变了生产者和消费者的关系。其中一个结果,随着 累积这些高颗粒度的数据,商家已经不再追求从单独的产品或服务中获取最大利润,而 是追求提供一个以客户需求为中心的综合服务,建立更高的客户忠诚度。普惠性就是 尽可能扩大客户的

13、多样性和数量,今天已经成为越来越多企业核心的商业目标。例如 Ichihashi在2020年的研究显示,很多数字平台希望向平台上的卖方公开买方的特征信息,而不是将买家隔离开,进行经济学家所谓的“价格歧视”一一以不同的价格向不同的 群体出售类似的产品,以便从支付意愿最高的消费者身上获取最大的利润。实际上,要 成功地进行价格歧视,卖方需要有能力将不同群体的消费者隔绝开。而今天的互联网让信 息隔离越来越难,消费者可以在非常广阔的范围内搜索不同的卖家和价格,让竞争越来越 激烈。价格歧视并非唯一的顾虑。美国的消费者保护机构,例如联邦贸易委员会担忧“企业 可以使用大数据,让那些低收入、缺乏服务的群体失去获得

14、信用服务和就业的机会”,并 说明要对这种不公平的行为进行指控。但现实中数字金融不断增强的普惠特性,将缓解这 样的担忧。至少在肯尼亚、中国和其他很多国家,普惠金融取得了突飞猛进的开展。所以, 在我们关注大数据杀熟的案例的同时,我们也不应该忘记这样的案例并非多数,也要具 体分析其背后的原因。其次,大数据是否在阻碍竞争,让市场出现赢者通吃的局面?关于数据竞争的一个普遍担忧是,网络平台的外部性(直接和间接的)和规模经济 可能带来市场进入障碍,从而引发赢者通吃的结果。从具体效果看,美国科技产业的一 些领域确实出现了市场集中度提升的现象,但中国却上演了一个非常不同的故事。在中 国,数据驱动的产业出现了强竞

15、争的特征,潜在的新竞争对手常常让在位的互联网企业 夜不能寐。例如电商行业,尽管在线零售占社会总零售比例已经超过27%,但由于激烈的竞 争,阿里巴巴这样的具备先发优势的领先者,面对市场新进入者和原有竞争对手的快速 增长。在短短四年内,阿里巴巴在中国电子商务销售额占比从2015年的78%降至2019 年的56%。拼多多作为市场新进入者,在3年内吸引了超过4亿用户,销售额增长超 过100倍。中国曾经最典型的大数据企业百度,长期统治中国的搜索引擎市场,并且曾在大数 据和人工智能领域遥遥领先,2010年它的市值大于阿里巴巴和腾讯,然而如今却远远落 后于这两家公司和很多新进入者。抖音的母公司字节跳动异军突

16、起,只用7年就超越百 度成为互联网广告收入领头羊。京东商城占中国电子商务销售额17%,它的投资者包括 谷歌和沃尔玛这样的巨头,最近成功“占据家用电器市场全渠道最大市场份额”2。在移 动支付市场,类似的激烈竞争也在频繁上演。这些证据说明,我们很难得出先发的大数 据优势会引发“赢者通吃”的结论。一个可能的解释是,大数据只是商业竞争的一个要素,并不必然决定行业的格局和 企业的命运。首先,在数字经济中,数据的使用只是商业模式运行的一局部。尽管在今 天的商业模式中,数据扮演了比以前更加重要的角色,但企业间的竞争仍旧由商业模式 及其执行决定。另外,与传统经济不同,数字服务的消费者可以选择多个平台一一用户参

17、见文章Alibaba, JD Lead in China, but a Few Others Are Making Dents, too 和Retail and Ecommerce Sales in China 20180参见 Wikipedia 词条“List of largest Internet companies”,文章The biggest ecommerce companies in China 一a brief guide和JD s Market Share Tops in All Channels of the Home Appliance Marketo可以选择提供类似服务的

18、不同供应商,从而多方提供自己的个人数据。再次,随着数据 的增加,数据的边际效用会随之下降。研究说明,如果一种资源能为企业带来垄断的竞 争优势,那么这种资源一定是无法模仿的、稀有的、高价值的且可持续产出的,“然而 通常数据并不具备上述任何一种特质(Lambrecht and Tucker , 2017)0显然,在数字经济的开展过程中,存在阻碍竞争的企业行为,需要通过法规纠正, 这也日益成为各国社会关注的一个重点。但这些现象,和所谓的“赢家通吃”,无论在理 论和实践中都没有必然的联系。我们对事情性质的判断,应该基于事实,基于不同国家、 不同行业的实际情况,而非基于假设的“黑板经济学”,否那么会适得

19、其反,阻碍数字经济的 开展。再次,大数据在多大程度上在给创新带来障碍?从事实上看,数字技术在已经带来深度影响的行业,包括媒体、社交媒体、电子商务、 金融、视频、出行和共享单车等等,几乎每一个行业都有新的商业模式和新的市场进入者。 在数字技术和数据的帮助下,这些新的商业模式为行业带来了 “破坏性创新”,也逼迫那 些墨守成规的成熟企业做出改变。在全球几乎所有市场,带来激进创新的企业都是那些资 金和资源非常有限,但拥有无限想象力和雄心壮志的初创企业。可以说,创新已深深烙印 在科技初创企业的DNA中。尽管有合理的疑问,但我们认为有几个原因可以说明,为什么大数据天然会推动产 品和生产流程的创新。第一,大

20、数据的三个V已经成为重要的生产模式和商业模式的创新引擎。企业连 接和了解客户的能力大大加强,因此可进行更明智的决策,并进行创新试验。这是在数 字技术深度改变的行业中,创新层出不穷的重要原因。第二,大数据的三个V带来了前所未见的大规模、深度合作,这也大大加速了创新 在市场中的部署和应用。平台作为连接供给和需求的载体,成为创新扩散的重要推动力 量。平台处于竞争压力,会愿意改进商业基础设施,推动平台上企业的创新开展。实际 上平台上的创新非常活跃,例如新品牌和小众品牌在各类平台上的爆发式增长,就是显 著证据。本报告的结构安排如下,第一章总结本报告的核心内容。按照逻辑递进的方式,第 二章基于消费者在隐私

21、相关决策时的实证分析,推导出不要单维度看待隐私,而需要综 合理解消费者和个人数据相关的权益。第三章谈论数据提供的价值源自何处。第四章介 绍从行业和企业的角度,做好隐私保护的核心逻辑和方法。第五章提供了一个基于数据 本质特征的综合理解数据权衡的框架。第六章运用这个框架理解全球数据治理的相关问 题,并且就数据和价格歧视、竞争、创新的关系,基于实证研究进行了讨论。第七章提 供了简短的总结思考。第2章从消费者权益的视角理解隐私悖论毋庸置疑,隐私保护对数字经济的开展,尤其是大数据技术的应用至关重要。关键问题 是:对消费者而言,何种程度的隐私保护是足够的?消费者在真实生活中,是如何决定 是否提供个人数据的

22、?隐私保护和个人信息提供之间是否存在权衡取舍?2.1. 让人费解的隐私悖论消费者提供个人数据的意愿究竟有多高?他们在多大程度上在意隐私保护?令人费解 的是,人们对这些问题的回答,与他们的实际行为往往相互矛盾。学术界称这一现象为 “隐私悖论”:大多数人表示自己在意隐私问题,却常常免费或在很少的经济补偿下,分 享自己的信息(图1)。图1:担忧很多,拒绝很少资料来源:CIGI-IPSOS, 2019,全球互联网平安和信任调查Global Survey on Internet Security and Trust 0注:该图表显示了全球互联网用户中担忧隐私泄露风险的比例(蓝色)与信任互联网从而愿意 提

23、供个人数据的比例(红色)。这种言行不一的行为模式普遍存在于全球各国,不分国家和文化。Eurobarometer 一项关于数据保护的调查显示,欧盟地区67%的公众担忧自己在互联网上无法控制个人信息1。美国皮尤研究中心的一项调查发现,美国93%的成年人认为有必要了解谁获取 了他们的个人信息2。中国消费者协会(2018)指出,80%的调查对象认为他们的数据发 生过泄露,并且被广告和销售 骚扰。Global Privacy Enforcement Network在2018 年的一项调查显示,只有28%的人对移动、宽带和通信设备运营商的信任度较高,对社 交平台的信任度更低,只有15%。尽管对隐私保护的焦

24、虑广泛存在,但很多人还是愿意提供自己的隐私数据,往往是 在没有或很少的经济补偿的情况下。当提供他人信息时,人们几乎无所顾忌。例如, Athey等(2017)研究者发现,因为一小块比萨,大多数参加他们实验的人就愿意提供自 己朋友的电邮地址。隐私悖论让学者和政策制定者困惑不已,难以理解为什么全球数十亿用户在提供个人 数据时会如此轻率,尤其很多人都曾在调研中表达过对隐私的忧虑。我们可以理解用户很 难拒绝使用诸如Facebook这样的主流应用,但互联网上每天都会产生大量新的应用,用 户也往往“来者不拒”。隐私悖论表达了用户在对待隐私问题上,言行之间的巨大差异。正 确地理解隐私悖论,对理解消费者对个人数

25、据提供涉及的权益诉求至关重要,是制定隐 私保护政策所需要考虑的关键因素。2.2. 通过大数据研究揭示用户的隐私决策目前对隐私悖论有几种不同的解释。一种观点认为,这是因为当事人不了解侵犯隐私 可能带来的严重后果。还有一种认为,由于目前主流隐私条款只能“接受或退出,一旦缺 乏其他可替代服务,用户不得不让渡一定的隐私权(Chen and Michael, 2012)0随着市场 竞争越来越激烈,很多可替代的产品正在涌现,这种解释越来越缺乏事实基础。另外, 认为用户不了解提供的严重后果和用户对隐私的普遍担忧是相悖的。第三种观点那么认为, 当面临真实选择时,是人们的行为,而不是口头表达,揭示了消费者对待数

26、据提供的真实 态度。因此,理解隐私悖论关键在于,当有选择自由时,用户在真实环境中行为如何。利 用支付宝数据,我们进行了一次大规模实验。支付宝目前的活跃用户超过io亿,并且 在平台上有几百万个小程序,有的来自小型初创公司,有的来自成熟大企业。为了使用 这些小程序,用户必须同意提供自己的个人数据。授权同意之后,用户也可以通过撤销 授权来退出。不同小程序要求的个人数据,在必要性和敏感度上各不相同。将这些差异 与用户特征和选择相结合,我们进行了一项迄今为止规模最大的、关于隐私决策的大数 据研究。参见 2015 年欧盟报道,Agreement on Commissions EU data protect

27、ion reform will boost Digital Single Marketo参见皮尤研究中心报道,Americans? Attitudes About Privacy, Security and Surveillanceo具体来说,我们聚焦小程序用户的授权和退出行为。研究小程序的授权和退出有几 个优势。首先,它反映了用户面临个人数据提供问题时的真实决策,而不是基于问卷调1研。基于问卷的研究,有一个明显的弊端,就是很难让调研对象对所提问题感同身受, 做出真实的选择。例如,汽车购买者常常在调研中夸大对燃油经济性和小排量发动机的偏 好(AnwyL 2011),这是因为在调研中,消费者不用

28、面对真实的本钱,包括小排量发动机 带来的空间、舒适性和平安性上的损失等。第二,支付宝用户涵盖了不同性别、年龄、收入和教育背景的群体,能比拟全面地 反映不同用户的行为差异。第三,我们的研究覆盖超过5万款的小程序,它们提供的服务和要求提供的个人数据 范围有很大不同。尽管用户很难绕开微信支付或支付宝,但对于是否使用这些小程序,用 户有足够的自主选择权,例如,他们可以决定是否为享受餐厅的订餐服务而提供自己的个 人信息。案例1显示,在支付宝平台使用特定服务时,不同用户在决定提供个人信息时有不 同的行为模式。这些行为模式与罗汉堂撰写的另一篇论文的结论一致(Chen et al., 2020)0案例1支付宝

29、小程序支付宝平台的活跃用户超过10亿人,并且拥有几百万款小程序。这些小程序 提供的服务几乎无所不包,从外卖到金融服务应有尽有。/./图2:支付宝小程序不同小程序需要的信息内容和信息敏感度各不相同。一些小程序只需要提供 用户姓名、位置和联系人列表等,还有一些那么要求提供用户的信用分。结合用户 不同的特征,这些差异可以提供丰富的洞察,了解用户在小程序提供的福利以及 隐私数据之间如何进行权衡选择。小程序提供的服务涵盖交通、娱乐、政务服务、餐饮和金融等等。例如,共 享单车小程序获得用户的信用数据后,可以让他们免押金租用单车。近年来,支 付宝上小程序数量快速增长。从2015年到2019年,小程序用户渗透

30、率从21%上 升至49%,用户规模上亿计。在使用前,小程序会要求用户进行数据授权。这些数据包括用户姓名、昵称、 性别、手机号、地址、网络信息、芝麻信用、支付账户、转账信息和相关服务信息等等。用户可以自由地进行授权和退出。当用户有选择权时,他们是否愿意提供个人信息,从而获得小程序提供的服务?我们发现的第一个行为模式是,当面临选择时,用户很乐意授权个人信息。如图3所示, 不同类型消费者小程序的授权率在64%-86%o平均授权率超过了 75%。男性、教育水平高 和年轻用户提供个人信息的整体意愿更高。在不同性别和教育水平的群组里,授权率差异 较小。拥有本科(以上)学历的用户,接受小程序的意愿更高。我们

31、通常猜想,教育程度 低(对隐私泄露严重后果的了解相对更少)的用户更易提供信息,但结果恰恰相反。不同 年龄段用户之间的差异最大,45岁以下用户授权率比45岁以上用户高出近20个百分点, 可能是因为年轻用户对在线服务更熟悉且使用更加熟练。图3:谁的个人信息授权率更高?资料来源:罗汉堂。注:授权率是小程序的访问者中选择允许小程序获取用户信息的比例。我们将具有博士学位、 硕士或学士学位的用户定义为高等教育用户。其余用户定义为低学历。年龄方面,我们以45岁 为界分成两组。人们不仅在大多数情况下愿意提供个人信息,使用小程序,而且他们后续也很少退 出,说明他们不会后悔自己的选择,至少没有足够的退出倾向。数据

32、显示,小程序的整 体退出率非常低,2016年-2019年每月只有0.12%的退出率。这意味着,大多数用户愿 意用个人信息换取服务。一旦做出授权,他们很少改变自己的决定,可能认为退出不太 重要,或对获得的服务感到满意。2020年的一篇学术论文得出了类似的结论,研究者发 现,在一个名为AdChoices的精准在线广告推送服务中,2010 一年美国用户的退出率 只有0.23% (Johnson et al., 2020)。加拿大和欧盟地区的用户退出率也很低,分别为 0.16% 和 0.26%。尽管用户愿意提供个人数据,但不代表他们不在意隐私。信息的敏感度越高,愿意 提供的用户就越少。我们的研究结果与

33、此前的研究发现相似(Goldfarb and Tucker, 2019),用户的隐私忧虑是根据不同因素相应变化的:信息的敏感度不同,用户的隐私 忧虑也不尽相同(图4)。与一般公共信息如昵称、头像相比,对于更加敏感的信息,例 如支付宝账号、机动车注册信息等,授权率平均降低了 20%o对于更年长的用户,例如 55-65周岁,这一差距进一步拉大到3。整体而言,人们更在意敏感信息的提供。资料来源:罗汉堂。需要芝麻信用授权,不需要芝麻信用授权0. 30%0.20%0. 10%(a)总退出率(b)敏感数据和非敏感数据退出率比照图5:用户退出率的变化资料来源:罗汉堂。注:(a)总退出率是指月均退出率,即月度

34、退出数除以月度授权数。当用户初次允许小程序访 问其个人资料,即视为授权发生。当用户拒绝或取消授权,那么视为退出。(b)敏感和非敏感数 据的退出率是每日退出率,每天退出人数占每日退出与授权人数总和的比例。值得注意的是,负面的隐私事件会大幅提升用户退出率。2018年,支付宝的年度账单事件就是一个例证3 O每到年末,支付宝会向用户提供年度账单,来总结他们在一年 中的消费。一般情况下,用户乐于与朋友提供自己的消费体验。然而在2018年1月,用参见南华早报报道,Alibaba s payments affi liate apologises for opting in users for credit

35、scoring system o目录第一章报告综述11.1 一个由数字信息定义的时代11.2 理解数据的本质31.2.1 从理解隐私悖论开始31.2.2 数据的价值来自何处? 41.2.3 如何缓解隐私风险? 61.2.4 如何从数据的本质看数据的权属、利益分配和保护责任问题? 71.3 数据治理问题81.3.1 数据治理的演进逻辑81.3.2 数据和竞争的关系9第二章从消费者权益的视角理解隐私悖论122.1 让人费解的隐私悖论 122.2 通过大数据研究揭示用户的隐私决策132.3 评估个人信息提供的风险19第三章数据的价值233.1 信息在数字时代的变革性意义233.2 数据在数字时代的价

36、值253.2.1 数字化连接:普惠性参与和协作到达前所未有的水平253.2.2 数据提供优化决策273.2.3 数字化建立信任31第四章隐私风险隐私保护和数据平安技术344.1 数字时代隐私风险源于何处? 354.2 隐私工程化和隐私加强技术374.3 数据平安43第五章全面理解数据本质的框架464.4 关于数据治理的几个核心问题506.1 数据隐私506.1.1 隐私保护原那么的开展进化506.1.2 隐私保护面临的挑战526.2 数据驱动业务的市场竞争53户在支付宝翻开2017年年度报告时,发现一个新的条款,要求用户授权信息开通信用 分。然而这一授权要求在声明中并缺乏够明显,用户认为应该更

37、加明确地进行通知。此 事件后,用户退出率明显提升了,月退出率从0.12%上升至0.3%,尽管之后又迅速恢 复至正常水平,并在2018年下半年进一步降低(图5)。由此可以看出,尽管用户很少 退出,但当他们认为隐私信息授权变更的知情权被损害时,就会“用脚投票”。随着用户使用数字产品的经验更加丰富,他们也更愿意提供个人信息。此前的研究 发现,随着人们对新产品和科技的了解增多,他们对隐私也更加关注(Acquisti et al., 2015; Goldfarb and Tucker, 2012)。我们的研究提供了更丰富的理解。我们发现,随着支 付宝使用时间的增多,授权率一开始会出现下降,证明了与新用户

38、相比,经验丰富的用户 确实会更谨慎地提供个人信息(图6a)。当使用时间超过4。个月后,授权率会回升至和新 用户相当的水平。这种模式揭示出一种U形的学习曲线,用户在长期内会接受更多的数 字应用。并且,这个趋势对敏感度不同的数据都存在(图6b)。所以,在长期来说,更丰富 的数字经验会让用户更加拥抱数字技术,提供个人数据的意愿也更强。100%90%新 尽 赛80%70%020 40 60 80 100 120 140 160 180100% 80%尽 密60%40%敏感信息,公共身份信息 其他信息020406080 100 120 140 160使用数字服务时长(月)使用数字服务时长(月)(a)授权

39、率和使用数字服务时长(b)授权率和所需要的信息图6:数字经验与授权率资料来源:罗汉堂。注:使用数字服务时长指的是距离用户初次注册支付宝的月数。用户在使用新的小程序时,并不会考虑这些应用的流行度;但那些使用人数少的小 程序,用户后期退出的几率会更高(图7)。我们用现有用户数来衡量小程序的受欢迎度。 可以看到,用户数和授权率之间并不存在明显的相关关系,这说明当用户在尝试新的服务 时,并不会在意使用人数多寡,但用户数少的小程序退出率更高。一个可能的解释是,用 户数少的小程序所提供的服务较差,因此退出率更高。最后,用户对数字平台的信任,比方此次研究中的支付宝,会鼓励他们更多地提供 个人数据。2019年

40、10月支付宝小程序进行了一项实验,将小程序用户界面中支付宝标 志移除,结果授权率降低了约3% (图8)。尽管移除标志并没有改变用户和小程序之间 的服务条款,却降低了一些用户对小程序的信任。一个相似的案例是在谷歌的开源安卓市场上,不同主体可以在较少限制下收集、传 输甚至交易数据,而用户一般对个人数据的控制较弱。一项研究分析了该市场中30万款40%30%榔S 20%取10%0%103104105106107 IO8用户数(a)退出率与受欢迎程度(b)授权率与受欢迎程度图7:退出率、授权率、及应用受欢迎程度资料来源:罗汉堂。注:我们将受欢迎程度定义为每个小程序用户的对数。图8:实验前后日均授权率变化

41、用户数资料来源:罗汉堂。手机应用,发现应用程序开发者的信誉会影响用户对隐私的忧虑(Kummer and Schulte, 2019)0综上所述,对用户隐私决策的大数据研究说明,在真实世界中,用户的隐私忧 虑确实存在,但与个人数据被肆意滥用而用户别无选择的俳殳想世界相比,是有巨大 差异的。如同全球其他国家一样,中国消费者也普遍关注隐私问题。但当面临选择时, 大局部用户会选择提供一定程度的个人信息,来换取数字服务带来的福利。不同信息敏 感度和服务质量也会在他们的决策中起到重要作用。此外,他们也关注隐私事件,并会 “用脚投票”。另一方面,他们很少改变自己的选择,表现在退出率较低。数字经验的日 渐丰富

42、,会让他们更谨慎地提供更多个人信息,但最终会接受更多的数字服务。这些行为 模式超越了性别、年龄以及教育背景的差异。这些证据说明,隐私保护非常重要,但只是消费者在决定是否提供个人信息时考虑 的因素之一。我们需要一个整体分析框架,来更好地理解数据提供带来的福利以及潜在 风险。最后,我们在另外一篇论文中发现,表达越强烈的隐私担忧的人,恰恰是使用小程 序最多的用户(Chen et al. - 2020 )0提供的数据越多,越关心隐私平安,但这并不阻碍 他们在获取服务的时候提供数据。隐私悖论并非源于无知或非理性行为。它凸显了数据 提供的实际价值,以及我们亟须找到更有效,本钱更低的方式去保护个人隐私。如果

43、绝 大局部用户实际上愿意提供数据来获得服务,只是他们同时也需要更好的隐私保护,那 么最好的隐私保护政策不是将个人数据束之高阁,也不是一味提升数据提供的本钱,而 是更高效地保护隐私和数据。2.3.评估个人信息提供的风险不同的人对提供个人信息的态度可能截然不同。从20世纪70年代末期到2004年 间,Westin-Harris消费者隐私调查调研了个人对信息技术的理解、质疑和担忧。通过调 研,他们编制了一个消费者隐私指数,将不同个体分为三类:“隐私根源主义者”:即使 可以从中获得更好的服务,这些消费者也不愿提供个人信息;“隐私实用主义者”:他们 会根据具体情况进行判断,看获得的服务是否值得信息提供;

44、“隐私乐观主义者”:他们 对个人数据的收集和使用并无担忧。每一类消费者的行为都有合理解释,因为他们对数 据平安的偏好不同,与获得服务之间的权衡也不同(Equifax-Harris Consumer Privacy Survey, 1991)0不同偏好的消费者占比是多少?全球数据驱动营销联盟(GDMA) 全球数据驱动营销联盟 GDMA (2018), Global Data Privacy: What the consumer really thinks?对全球10个国 家的消费者进行的调查发现,51%的消费者属于实用主义者,26%属于乐观主义者,只 有23%是隐私根源主义者。结合这一发现,我们

45、分析认为,在提供个人信息有足够的好 处时,大多数用户是愿意提供的(26%乐观主义+51%实用主义),并且由此来获得服务 和福利。(见图9)乐观主义者26%隐私根源主义者23%图9:消费者隐私态度分类资料来源:全球数据驱动营销联盟GDMA(2018)。从消费者权益的角度出发,我们能更全面地理解消费者对待隐私的真正态度,以及他 们在提供个人信息时的偏好。受到行为经济学家启发(Kahneman and Tversky, 1984),我 们可以得到一个结论,当消费者提供个人信息时,他们既有可能获得福利,也面临风险(Culnan and Bies, 2003)0这种共识后来开展为所谓的“隐私权衡理论”(

46、Culnan and Bies, 2003; Dinev and Hart, 2006; Laufer and Wolfe, 1977; H. J. Smith et al., 2011; Xu et al., 2009)0隐私权衡理论认为,在提供个人数据时,消费者通常会进行一个本钱收益分 析,将福利与潜在的风险进行权衡,如图ioa所示。当预计的收益大于风险时,消费 者倾向于披露他们的个人信息,反之那么会拒绝。研究支付宝小程序的发现与隐私权衡理论的观点相符。当消费者进行提供信息的决 策时,信息的敏感度、隐私事件以及服务的质量都是他们计算的相关因素。更为重要的 是,不同人群,或相同人群数字服务的

47、经验的多寡,都会产生不同的权衡结果。整体而 言,年轻人对数字服务最热情,一方面他们隐私信息相对较少,态度更加乐观,另一方 面,与其他年龄组相比,他们对数字技术更加熟悉且从中享受到更多福利(图iob)。有 趣的是,从20岁年龄组到50岁年龄组,随着年龄增长,授权率呈下降的趋势,50岁 以上又开始提升,似乎提供个人信息的风险在权衡比重中下降了。此前的研究也发现,隐私问题正变得越来越重要。Goldfarb和Tucker指出,在美 国,人们对隐私的担忧正在增加(图lia) (2012)0他们在2001至2008年投放了在线 问卷,调查人们是否愿意披露自己的收入信息。结果显示,拒绝率每年上升1.3%。所

48、有 年龄层都出现了相同的趋势。类似的是,2015年Acquisti等学者的研究发现,从2005(a)隐私风险/ 代价100%隐私权衡(b)授权率与用户年龄图10:隐私计算和消费者授权率资料来源:罗汉堂。(a)拒绝提供收入信息的比例社交媒体上的隐私掇露程度不日看同色交口体档案达索公弁叫t (2005 20H)(b)社交媒体上披露个人信息的比例图11:不同时期个人信息披露习惯的变化资料来源:(a) Goldfarb and Tucker (2012); (b) Acquisti (2015)0到2011年,在卡耐基梅隆大学的Facebook网络里,公开提供自己生日和高中信息的比 例在逐年下降(图lib)。第3章数据的价值上一章的大数据分析说明,大多数用户愿意提供个人信息,从而享受数字服务。这自然 引出了新的问题:数据到底给用户带

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁