《2023年-年全球大数据白皮书.docx》由会员分享,可在线阅读,更多相关《2023年-年全球大数据白皮书.docx(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、美国白宫:2014年全球”大数据“白皮书一一(浙江大学译)Posted on 2014 年 05 月 29 日 by ooodong in 数据行业,行业资讯 with 0 Comments 大数据:抓住机遇、保存价值美国总统行政办公室2014年5月概述:“即使大数据技术重塑了我们周围的世界,今天的发言也将帮助我们持续贯彻自身的价值观 念。”“这份评估报告本质上被认为是一种对大数据作用范围的调查。在过去的90天中,评 估小组对学术专家、产业代表、保护个人隐私的倡导者、人权团体、执法者,以及其它政府 机构进行了调研。白宫科学与技术政策办公室(White House Office of Scien
2、ce and Technology Policy)与麻省理工大学、纽约大学、加州伯克利大学联合组织了三场大学会议。”“在2014 年,美国国税局通过一个名为Get transcript的工具将纳税人的信息数据加以共享,纳税 人可以通过它获得他们自己最近三年的纳税记录。个人纳税者可以借此下载过去的纳税申报 单,这使得居民进行抵押、学生贷款、商务贷款等活动与填写纳税表变得更加便捷J“尽管医学技术不断变化,但健康数据仍然是我们生活中非常私密的部分。在大数据使得较 之以往任何时候都更为强大的发现成为可能的同时,重新审视相关信息被所有医疗保健机构 共享后的隐私保密方式也显得相当重要。医疗保健行业的领导者
3、已经呼吁构建一个更为广泛 的信用框架,使得不同来源、不同隐私保密程度的健康数据得以汇聚。这一框架需要附加健 康保险便利和责任法案与反基因歧视法(uGenetic Information Non-Discrimination Act,J, GINDA)中的隐私保护条款,并同时设计标准化数据结构以提高 其跨平台适应性。”“大数据正在改变世界。但是它并没有改变美国人对于保护个人隐私、确保公平或是防止歧 视的坚定信仰。这份调查报告旨在鼓励使用数据以推动社会进步,特别是在市场与现有的机 构并未以其他方式来支持这样的进步的领域,与此同时,我们也需要相应的框架、结构与研 究,来帮助保护我们的核心价值观念。给
4、总统的一封信亲爱的总统先生:我们正生活在社会、经济与技术革命之中。我们如何通信、交际、度过闲暇时光以及开展业 务已经转移到了互联网上。互联网又渗透进入我们的手机,进入蔓延在我们家园和城市中的 设备中,进入推动工业经济的工厂中。其导致的数据爆炸和挖掘正改变着我们的世界。今年一月,你要求我们进行为期90天的调查,检验大数据将如何改变我们生活和工作的方 式,改变政府、公民、企业家和消费者之间的关系。这次调查的重点在于公共和私营部门如 众有着同样长的历史。宪法第二章第一款授权进行十年一度的人口普查,以分配美国众议院 议席。在实践中,人口普查从来没有仅仅只进行简单的人数计算,而是收集一些更为具体的 以公
5、共利益为目的的人口统计信息。自从奥巴马总统执政以来,联邦政府采取了史无前例的政策措施,将更多的它所拥有的数据 向公众、公司与创新者开放。从2009年开始,奥巴马政府将大量资料库向公众开放,并且 将许多数据公布在美国政府的中央信息交换库一一Data.gov网站上。这种将政府的信息数 据当作一种资产并加以披露,使其易于获取与使用的做法,换句话说,就是信息的公开化。 这大大加强了社会民主程度、开拓了经济发展机会、改善了公众生活质量。奥巴马政府关于公开数据的举措公开数据计划根据政府的公开数据,我们凭借口袋里的智能手机就能知道我们所处的位置。几十年前,联 邦政府将气象数据与全球定位系统免费对外开放,企业
6、家们得以发明大量的新工具,提供新 型服务,天气预报APP、汽车导航系统等新发明因而不断涌现。在过去,政府收集数据的方式主要是由政府机构自己进行收集,而奥巴马政府的一系列公开 数据的倡议与决策,使得过去在健康、能源、气候、教育、经济、公共安全与全球发展等领 域内难以收集的数据变得易于收集,开启了一个新的富有价值的数据宝库。奥巴马在2013 年5月9日签署的第13642号总统行政令为联邦数据管理工作提出了新的准则:在保护 好隐私安全性与机密性的同时,将数据公开化以及可读写化纳入政府的义务范围。扩大公开 数据的影响也同样是总统第二期管理工作规划的核心部分,例如管理和预算办公室(Office of M
7、anagement and Budget, 0MB)就已经建议其下属机构公开更多他们决策所依据的政府信 息,因此,相信信息公开将可以惠及更多的人。公众在Data.gov网站上可以找到有关联邦消费者金融保护局(Consumer Financial Protection Bureau, CFPB)受到的所有抗议的信息,这些抗议主要针对于阿肯色州学生贷款的911个服 务领域。这表明每个人可以利用Data.gov网站获得他们所需要的公开信息,而不需要对政 府机构和这些机构所推动的工作项目有特别多的了解。感兴趣的软件开发者运用一些简单的 工具,就能够自动获得这些数据包的信息。联邦机构在某种程度上应根据公
8、众的要求优先公布它们的数据以扩大数据的影响面,每一个 机构都被要求需通过诸如邮件系统或是在线平台等数据反馈机制来征求它们应当收集哪些 数据。这样一来,任何倡议者、企业家、研究者就能第一时间联系联邦政府,建议哪些数据 应该被公开。为了更进一步的形成反馈并促进政府公开信息的有效使用,政府官员一直在积 极召开并参与编码马拉松(code-a-thons)、头脑风暴工作坊(Data Jams)、数据开放运动 (Datapaloozas)与其他的一些以数据开放为主题的会议。根据2013年5月的总统行政令,管理与预算办公室以及科技政策办公室(Office of Science and Technology
9、Policy, OSTP)发布了一个工作框架方案,为各机构管理运用即时更新的信息 资源这一新形式财产提供指导,包括了对保护个人隐私、信息可信度的一系列要求30o政 府机构根据开放程度已将信息资产划分为三个种类:开放性、半开放性、非开放性,并且只 能出版发行开放性密级的信息。为了增进透明度,一些机构需将一些还没公布到网上的技术 性公开数据纳入他们的外部数据财产清单。“我的大数据”计划使政府信息更公开透明、更易被机器读写仅仅是政府信息政策的一个组成部分。1974年颁 布的隐私权法案授予了公民可接触一些与其有关的个人信息的权利,公民行使这一权利 应该变得更加安全高效,从2010年开始,奥巴马政府着手
10、采取了一系列主题为“我的大数 据”的倡议与措施,使得美国人可以更安全地获取他们的个人数据,用来更好地处理他们私 人领域的申请活动和服务。“我的大数据”计划具体包括以下部分:“蓝纽扣”计划:“蓝纽扣”允许消费者安全地获取他们的健康信息,使得他们可以更好 地管理他们的健康与经济状况,并与信息提供者交换相关信息。在2010年,美国退伍军人 事务部(U.S. D印artment of Veterans Affairs, DVA)开始了 “蓝纽扣”计划,退伍老兵可以通过 该计划下载他们的健康记录。从那时起,540万退伍军人利用“蓝纽扣”获取他们的健康信 息,超过五百家私人公司允诺向“蓝纽扣”计划的参与者
11、提供更多他们所掌握的健康数据, 今天,超过L5亿的美国人能够从健康服务提供商、医药实验室、零售药房供应商与州免 疫信息数据库获得他们所需的个人健康数据。“创建副本”计戈1J:在2014年,美国国税局通过一个名为“Get transcript”的工具将纳税 人的信息数据加以共享,纳税人可以通过它获得他们自己最近三年的纳税记录。个人纳税者 可以借此下载过去的纳税申报单,这使得居民进行抵押、学生贷款、商务贷款等活动与填写 纳税表更加便捷。“绿纽扣”计划:在2012年,美国政府与电力行业合作推出了 “绿纽扣”计划,这为家庭 与企业提供了便捷的途径来获得他们的能源使用信息,并且有利于营造良好的消费者环境
12、 与电子化模式。今天,为5900万家庭与企业提供服务的48家电力供应商通过参与“绿纽 扣”计戈帮助他们的消费者节约资源。凭借自身掌握的能源数据,消费者可以选择享受何 种私人服务,以更好地管理他们的能源消耗状况来达到理财的目的。“我的学生数据”计划:教育部将助学金免费申请表与联邦助学情况的一些信息共享,这 些信息囊括了借贷、补助金、注册与超额偿付等方面的具体事项,这使得学生与资助人能够 上网下载所需信息资源。在这些计划中,信息都是通过“注重使用者体验”、“机器可读写”、“文本信息平面化”的方式实现共享的。除了为人们提供安全、高效的个人信息、,“我的大数据”计划帮助建立了一个有效的个人数 据获得性
13、模型,政府也希望将其推广到更多的私人与公众领域。获取个人信息的能力在未来 将会变得越来越重要,生活的各个方面都将会逐步卷入到个人、公司与公共组织的信息交换 之中。大数据计划:“数据-知识-行动” 在未来,“大数据”将会成为这个信息交换过程的核心,使得数据转化为知识,并进而转 化为行动的过程更加快捷。在2012年3月29日,六个联邦机构加入到“大数据研究和 发展计划(Big data Research and Development Initiative”)中来,超过两亿的科研经费被 用于工具与技术开发以推进对海量数据进行获取、组织与整理并发现有效信息的相关技术发 展。自从“数据-知识-行动”(
14、“Data to Knowledge to Action”)计划实施以来,在1亿美金的 “XDATA”项目支持下,美国国防部先进项目研究局(Defense Advanced Research ProjectsAgency, DARPA)创建了一个关于研究出版物与公开化资源软件的“开放目录”,努力发展能 够处理分析存在缺陷的、不完整的海量数据的技术32。国家卫生研究院(National Institutes of Health, NIH)也拿出5000万美金支持开展生物领域的“数据-知识-行动”计划。国家科学基 金会(National Science Foundation, NSF)赞助的大数据
15、研究计划,为人类基因组研究节省了 40%的经费。能源部也宣布向“可扩展数据的管理分析及其可视化协会(“Scalable Data Management, Analysis, and Visualization Institute v)提供一项 2500 万美元的赞助,这家机构 所处理的气候数据信息使得季节性台风预报的准确性提高了 25%以上。还有许多针对大数 据的研究支持计划,比如奥巴马总统2013年4月发布的创新神经技术脑(BRAIN)计划。 作为政府大数据计划的组成部分,国家科学基金会为大数据中出现的社会、道德与公共政策 问题的相关研究也提供了特别的资金支持。美国隐私法案和国际隐私法框架美
16、国隐私法的发展工业革命带来的技术革新浪潮使得社会发生巨大变迁,隐私法正是在这一社会背景上发 展起来的。隐私权最初由美国学者沃伦(Samuel Warren)和布兰蒂斯(Louis Brandeis)在1890 年由两人合著的著名法学论文隐私权一文中提出,初代可便携照相机的出现直接促成了 他们观点的提出,在论文中,他们指出“最近的发明与商业应用将人们的目光吸引到个人隐 私权的保护上来,这项权利应不受侵犯很多技术发明威胁到了隐私权,窃窃私语被公 之于众的预言可能被实现J提出建立普遍性的隐私保护法的倡议出现在20世纪,这一 倡议富有预见性,建立了从政府到个人的涵盖各个方面的公民隐私权。案例法历经了上
17、个世纪的发展,其中关于宪法第四修正案的解释条目随着时间与技术的发展 也在不断进行调整。在1928年,联邦最高法院受理了 “欧姆斯戴德诉美国联邦政府” (Olmstead v. United States)一案并宣判在诉讼人屋外设置电话窃听装置并没有违反宪法第四 修正案,即使政府以此获得了屋内谈话的内容。但是,欧姆斯戴德案的裁定因为贾斯蒂斯布 兰蒂斯(Justice Brandeis)的抗辩而传播得更广,他写道:“国父们曾经授予公民其隐私不可侵 犯的权利以限制政府的行为。”欧姆斯戴德案的法庭决议一宜沿用,直到1967年“卡茨诉联邦政府(KatzUnited States) 一案才被推翻。法庭认为
18、,联邦调查局(Federal Bureau of Investigation, FBI)在没有调查授权 的情况下在公用电话亭外安装监听记录装置,侵害了个人使用公用电话时应有的同时也是符 合个人期待的隐私权,即使这个装置没有置于电话亭内部,或是身体以及财物上。此后,主 观期待的隐私权得到保护,社会也开始将这视为理所当然。民事法庭并没有立即将隐私权认定为一个公民向他者提起诉讼的正当理由一一也就是律师 们常说的“诉因”(“cause of action”)。直到1934年的侵权行为法中,无正当理由地 严重侵犯个人隐私才被正式确定为可作为起诉的基本出发点。大多数州的法院这才开始将隐 私权认定为诉因,这
19、份规定并不是对民事侵权行为的单独一款规定,而是由4款复杂的规 定组成的:行为侵犯个人私人空间或私人事务公开散播个人隐私为丑化某人信息而将信息公开为了非个人本人目的而挪用了个人肖像现在许多批评认为这四款并没有很好地解决隐私问题,市场经济下因商业目的而大范围收 集、使用、散播个人信息的现象仍很严重。同时一些人声称,自动化的程序应该能减轻隐私 问题给公众带来的忧虑,因为它是使用电脑来进行操作并完成一系列任务,而不是像过去一 样由人来操作完成。信息公平实践原则随着计算技术的发展与它在政府和私人间的应用更加普及,全球的政策制定者们开始重新审 视它与隐私的关系。1973年,美国卫生、教育与福利部发布了一份
20、题为“录音、计算机与 公民权利”(“Records, Computers, and the Rights of Citizens”)的报告。报告分析了 “自动化 个人数据系统可能导致的不良后果”并建议建立信息使用的保障措施。这些措施,也就是如 今广为人知的“公平信息实务法则”(FIPPs),成为了当今数据保护制度的奠基石。尽管这些法则在法律与国际公约中都有不同的表现形式,但本质上,“公平信息实务法则” 清楚地表达了处理个人信息时的基本保护措施。它规定个人有权知道他人收集了那些关于他 的信息,以及这些信息是如何被使用的。进一步说,个人有权拒绝某些信息使用并更正不准 确的信息。信息收集组织有义务保
21、证信息的可靠性并保护信息安全。这些法则成为了 1974 年隐私法的基础,这一法案规范了联邦政府在个人信息的维护、收集、使用与传播等方 面的行为。19世纪70年代后期,几个其他国家也相继通过了隐私法。1980年,经济合作及发展组 织(OECD)发布了其关于隐私保护和个人信息跨界流动管理的指导(“Guidelines Governing the Protection of Privacy and Transborder Flow of Personal Data)。基于“公平信息 实务法则”的经济合作及发展组织指导并提供了关于过去三十年里国家隐私法,特别行业 隐私法及其实践的信息。1981年,欧洲
22、委员会通过了个人信息自动处理中的个人保护公 约(“Automatic Processing of Personal Data,Convention 108),这一公约采用“公平信息 实务法则”的手段来凸显欧洲对于隐私权的保护。尽管有一些关键的不同,但是美国和欧盟国家关于隐私权保护的框架都是基于“公平信息 实务法则”。基于隐私权是基本人权这一认识,欧洲国家的保护措施通常包括自上而下的 严格法制与对于个人信息的使用的全面限制或是要求信息主体的明确同意。相对的,美国则 通常采用在例如医疗保障与信用体系等特别领域实施特别规定来管控特定的风险。这使得美 国很少有对于信息使用的全领域普适规则,从而为产品与
23、服务的创新留下空间。但是,但这 也为潜在的数据跨领域使用留下了空间“公平信息实务法则”形成了诸多部门法与国际公 约的共同思路。他们被编入2004年亚洲太平洋经济合作组织隐私权法则(Asia Pacific Economic Cooperation Privacy Principles),这一文件由亚洲太平洋经济合作组织(简称亚 太经合组织或APEC)成员国签署通过,并构成美国-欧盟与美国-瑞士的安全港框架基础, 这一框架将以对于“公平信息实务法则”的一致观点作为沟通美欧法律的基础。美国特定行业的隐私法上世纪七八十年代的美国,特别制定的行业法律开始出现并作为以侵权行为为基础的习惯法 的补充。这些
24、法律只对特定的数据提供保护。除了少数例外,大多数州与联邦政府都通过了 相应法律。公平信用报告法案(“Fair Credit Reporting Act,FCRA)最初颁布于1970年,这一法案 旨在促进消费报告机构所收集的信息的准确性与公平性的同时,推进相关隐私保护。这些信 息被用于信用与保险报告、雇员背景调查与租户筛查。这一法案赋予了个人访问与修正个人 信息的权利,从而保护了消费者的权利。它要求那些提供消费者报告的公司确保信息的准确 与完整;它限制这些信息的使用;它要求这些机构在依据报告进行不利于当事人的措施(例 如拒绝贷款)时需尽到告知的义务。1996年的 健康保险携带与责任法案(“Hea
25、lth Insurance Portability and Accountability Act ,HIPAA)规定个人健康信息只能被特定的、法案中明确的主体使用并披 露,法案中也包括了用于帮助个人了解并控制其健康信息使用的标准。49健康保险携带与 责任法案(HIPAA)的核心原则是“最小化必须”(“minimum necessary)原则。5。国会与 卫生部会周期性地升级健康数据的保护。1998年儿童在线隐私保护法案(“Children s Online Privacy Protection Act,COPPA)和联邦贸易委员会(Federal Trade Commission, FTC)
26、的法令要求用于13岁以下儿童的在线服务或要收集儿童个人信息的在线服务需要获得父 母的同意才能进行。在金融领域,金融服务现代化法案(“GrammLeach-Bliley Act”, GLBA) 要求金融机构尊重客户隐私并保护客户非公共信息的安全与机密。在诸如教育,通信,录像 带租借与基因信息等其他领域,也有相应法案保障隐私。消费者隐私权法案2012年2月,白宫发布了一篇名为消费者数据隐私权的报告:在全球数字化经济环境下保 护隐私权与促进创新的新体系框架(Consumer Data Privacy in a Networked World: A Framework for Protecting P
27、rivacy and Promoting Innovation in the Global Digital Economy 52 这种“隐私”蓝图包含四个关键要素:基于信息公平实践原则的消费者隐私权法案;呼吁政 府的多方利益相关者在特定的商业环境应用这些原则;对隐私权有效执行与对制定消费者隐 私权立法基准的支持;对支持数据跨国流动的国际隐私权制度的承诺。隐私权蓝图的核心是消费者隐私权利法案,它对消费者保护标准进行明确规定。这些权利是:个人控制:消费者可以对企业从自己这里收集什么信息,以及如何使用这些信息进行控制 透明:消费者有权简单易懂地获取有关隐私权与安全实践的信息。相关环境:消费者有权得知
28、企业如何在消费者提供信息的相关环境方面进行收集、使用与披 露用户数据安全:消费者的个人数据必须得到安全与负责任地处理可修改和准确性:因个人数据的敏感性,以及不准确的数据会对消费者有产生不良后果的风 险,消费者有权查阅并更正个人资料聚焦收集:企业在合理的限度内收集与保存用户数据问责:拥有个人数据的公司有义务采取适当措施,以确保它们符合消费者隐私权法案(u Consumer Privacy Bill of Rights n , CPBR)消费者隐私权法案更加关注消费者而非仅仅是以往用法律术语表达的隐私结构。比如, 它根据“易接受性和准确性”(“access and accuracy)的原则对权利进
29、行描述,与以往对于 “数据的质量和完整性”的公式化表达相比,更易为用户理解。同样的,它确保了公司将会 尊重从消费者收集与使用数据的背景环境,从而取代“目的说明”(“purpose specification”)。消费者隐私权法案还借鉴了公平信息实践的原则以更好地适应我们所生活的网络环境。与要求企业遵循一系列专一、严格的条令不同,消费者隐私权法案建立了一般原则并提 供给企业自由决定如何实施这些条令的权力。消费者隐私权法案的相关环境原则与其他 六大原则相互间产生作用,确保消费者的数据将以符合他们的期望收集并使用。与此同时, 相关环境原则允许了企业在信息的使用与“企业-用户”间的关系以及围绕如何收集
30、数据的 环境保持一致时,可以开展新的能够使用个人信息的服务。互联网的复杂性、全球性与持续的发展需要及时的、可发展的创新扶持政策。为了应对这个 挑战,隐私法的蓝图呼吁所有利益相关者聚集到一起,制定自愿性的,强制性的行为准 则,明确规范如何将消费者隐私权法案应用到具体的商业环境中。消费者隐私权法案 是基于广泛的基准原则与具体的行动守则的结合,能够在支持创新的同时保护好消费者。提升全球互操作性在其他国家与国际组织开始复核他们的隐私保护框架时,奥巴马政府发布了消费者隐私 权法案。在2013年,经济合作与发展组织升级了自己的隐私权指导方针,这在机制上 补充了公平信息实践原则,帮助落实并加强了隐私保护。在
31、2013年发布的亚太经合组织跨 境隐私规则系统,也在很大程度上效法了经济合作与发展组织的指导方针。53欧委会正在 审核第108号协定(个人信息自动处理中的个人保护公约,uAutomatic Processing of Personal Data”)。在这些不同的隐私保护框架之间建立桥梁,对确保国际贸易的强劲增 长是至关重要的。欧盟也正在推进其数据保护规则的改革进程。现有的欧盟数据保护指令仅允许欧盟公民数据 享有“充分的隐私保护法案,或向拥有有效的数据安全保护机制的国家(如美国-欧盟安 全港协议)流出。在2014年1月,美国与欧盟开始协商,如何加强安全港协议框架以确 保它能继续提供有力的数据保护
32、,并且能使提高其透明度,得到有效执行与法律上确定性 三者成为可能。这些谈判都还在继续,即使像欧洲I、美国,也都在磋商这些隐私保护框架将 如何适应大数据技术的同时,能够增加计算与存储能力。在2014年3月,联邦贸易委员会与欧盟机构的官员连同亚太经合组织一同宣布,欧盟与 亚太经合组织将发布共同的计划文件,满足双方在隐私保护框架方面的共同需求。56这项 筹划工作将帮助那些在欧盟与亚太经合组织地区同时进行贸易的公司解决在两方隐私保护 中的认证问题,避免因双方框架不一致或重叠所带来的困难。这样的努力澄清了公司的义务, 帮助在全球隐私框架之间建立起相互间的操作性。结论目前最普遍的隐私风险依然是涉及“小数据
33、”一一定向妥协的内容,例如,以个人银行信息 为目的的金融诈骗。这些风险并不涉及到大量的、急速的数据,或是繁多的信息种类,也没 有隐含有与大数据有关的复杂化信息。对于“小数据”的隐私保护在美国已通过公平信息实 践原则,借由特定的部门法律,强有力的执法部门与全球隐私保护机制得到有效的解决。隐私权方面的学者,政策制定者与技术专家现在正转向大数据的问题,即如何在“公平信 息实务法则”的基础框架下对大数据技术进行有效的管理。这份调查报告的剩余部分就将探 索大数据在公共与私营领域的应用,然后将考虑大数据的整体应用对现有隐私保护框架的可 能影响。公共部门的数据管理国家维护着和平,并同时保障食物的安全,确保空
34、气与水源的干净。为此,它颁布法律法规 来规范经济与政治行为,而大数据技术则有望使这些政府所提供的服务得到全面的提升。本章将探讨大数据是如何帮助政府更好地履行它在医疗、教育、国土安全以及法律执行方面 的职责,并指出大数据带来的挑战。自建国起,关于政府应该做什么、不应该做什么的讨论 以及如何在科技日益发展的同时保护公民权利的疑问就不曾间断过。当合众国的奠基者们为 这个年轻的国家制定法律与规范时,他们就为如何避免私人空间受到政府不恰当的干预而苦 苦思索。而今天,大数据带来的改变或许会让他们大吃一惊:摩尔定律和泽字节正与宪法和 权力法案一样,在国会的争论中起到举足轻重的作用。从核心层面上讲,政府机构对
35、于大数据的使用会加剧我们对政府与个人间权力平衡的担忧。 公民信息一旦为了某个特定的目的而被编辑整理,它们就很有可能被用于其他目的,这在国 家处于紧急状态时将显得尤为突出。政府在二战期间滥用其数据便是其中最为可耻的例子之 一:本是在严格的保密条件下搜集的普查数据被用来确定日裔美国人的居住地并以此来将其 扣留至集中营直到战争结束。因为政府在为公众利益行使权利与权威的同时承担着特殊的责任,所以我们必须慎重考虑大 数据在公共部门的使用方式以及对政府部门的数据使用的控制与限制方法。如果任其发展, 大数据可能成为政府权力凌驾于公民权力之上的工具。而与此同时,大数据也能被用于进一 步加强责任制,并设计一套从
36、本质上更尊重个人隐私与公民权利的政治系统。大数据与医疗保健服务数据一直是医疗保健服务中的一部分。在过去的儿年中,议会出台了相关法案来鼓励医疗保 健服务供应商过渡至使用电子病历,这极大地提高了可供临床医生、研究者与病人使用的数 据量。随着患者保护与平价医疗法案(“Affordable Care Act”,ACA)的制定,医疗保险 的偿付机制正开始从相互分隔、具有潜在不协调性的“按服务收费”(“fee-for-service”)模 式转变至基于更佳健康状况的付费模式。总而言之,这些趋势正在帮助形成一个“学习型” 医疗保健系统,在此系统内,临床数据将迅速反馈给患者并指导治疗有效进行。大数据可以确定饮
37、食、运动、预防护理和其他生活方式因素对健康的影响,使得人们不必向 医生寻求医疗保健意见。大数据分析能够帮助确定临床治疗、处方药剂以及公共卫生干预对 于特定或广泛群体的效果,并对传统研究方式提供参考。从支付角度来看,大数据能够保证 给患者提供治疗的医生有优秀的临床记录,同时,治疗的费用根据患者的康复效果而非治疗 本身的次数确定。预测医学的新起是大数据在健康领域的终极运用。这项强大的技术可以同时深入解析一个人 的健康状况与遗传信息,使医生更好地预测特定疾病在特定个体上是否可能发生,并预测患 者对于特定治疗方式的反应。与此同时,预测医学提出了许多复杂的问题。传统意义上,健 康数据的隐私政策都力求在临
38、床信息被分享与分析的同时保护相关患者的个人身份信息。而 逐渐地,基于特定群体或人群的数据将在临床症状出现前或出现后不久被用于确定疾病的类 型。但是,预测医学挖掘出的信息所带来的风险将超出单一个体,一旦出现差错,不仅遗传信息 提供者本人,他的孩子以及未来的后代等拥有与他相似遗传信息的人都将会受到牵连。因此, 将基因组数据与医疗保健数据相连接的生物数据库便成为了个人隐私在医学研究与治疗领 域中的无法回避的前沿话话题。目前的隐私框架在不久前才包括了正在使用的健康信息,这一框架或许不能很好地解决上述 发展带来的问题并推动相关研究的进行。运用大数据来改善健康状况需要先进的分析模型来 摄取包括生活方式、基
39、因组、医疗与财务数据在内的多种信息。生活方式与健康状况之间的 紧密关系意味着个人数据与医疗保健数据之间的界限已经开始模糊。而这些类型的数据却收 到不同的、有时甚至是相互冲突的联邦和各州政府的监管,其中包括健康保险便利和责任 法案(uHealth Insurance Portability and Accountability Actv , HIPAA)金融服务法现代化 法案(Gramm-Leach-Bliley Act” , GLBA)、公平信贷报告法案(“Fair Credit Reporting Act”,FCRA)与联邦贸易委员会法案(“Federal Trade Commission
40、Act”,FTCA)O当数 据的来源多种多样时,同时遵守多个法律带来的复杂性随之增加,与此同时: 医疗机构还会 与不受上述法律约束的许多组织相互勾结,形成一整套利益链条,各种个人健康信息被一系 列企业共享,甚至于州政府会违背消费者对个人医疗数据隐私保护的意愿而出售其相关数 据。在此情况下,针对医疗保健领域的大数据部门的设立也就成为了迫切之需,此举同时有 望进一步降低行业成本并激发发展潜力。尽管医学技术不断变化,但健康数据仍然是我们生活中非常私密的部分。在大数据使得较之 以往任何时候都更为强大的发现成为可能的同时,重新审视相关信息被所有医疗保健机构共 享后的隐私保密方式也显得相当重要。医疗保健行
41、业的领导者已经呼吁构建一个更为广泛的 信用框架,使得不同来源、不同隐私保密程度的健康数据得以汇聚。这一框架需要附加健 康保险便利和责任法案与反基因歧视法(uGenetic Information Non-Discrimination Act”, GINDA)中的隐私保护条款,并同时设计标准化数据结构以提高其跨平台适应性。在研究了 健康信息技术后,总统科技顾问委员会得出以下结论:国家需要建立统一的数据标准与结构 使不同类型的数据记录可以在受到控制的条件下方便访问。在医疗数据保密框架逐步跟进技术发展的过程中,需要全美医疗保健与保险的供应商之间细 致协商,而这份努力,将为未来的国民经济与公民健康的福
42、祉奠定基础。对学习的研究:大数据与教育如今,上到大学,下至幼儿园,众多科技帮助并提升了学生在课内外的学习过程。获取学习 资料、观看授课视频、评价教学活动、进行团队合作、完成家庭作业、参加课程考试,这一 切都可以在互联网上完成。这些基于科技进步的工具与平台给予了学生与教师更多的可能性。仅需数代的革新,这些工 具就能提供实时的评估来使学习资料能够按照学生的接受速度来进行演示。不仅如此,教育 技术还能扩大受教育人数、增进学生间的互动并使教学内容的持续性反馈成为可能。除了个性化的教育,新的数据类型的运用使得研究者对于学习行为的研究能力有了质的飞 跃。从大规模开放在线课堂等基于科技的学习平台上获取的数据
43、可以被精确跟踪,借助这些 数据,我们能够进行对远超传统教育方式的探索,对学生学习轨迹的移动进行更为准确与广 泛的研究。具体包括:深入了解学生在学习活动中的接收效果,根据不同的学习目标,选择 合适的学习资料,并进一步地运用这些数据帮助那些处于相似状况的学生。目前,教育部正 在研究如何运用这些科技,并已开始整合国家教育技术计划下在线教学平台所产生的数据, 并计划成立虚拟学习实验室,为进一步的研究提供方法论上的指导。教育领域的大数据革命同时也带来了一些亟待解决的问题:随着科技日益深入课堂教学,我 们如何最好地确保学生的隐私不受侵犯。一方面,各州与本地社区历来都是教育的主要提供 者;另一方面,大量的在
44、线学习工具与课程都是由盈利性企业提供。这就导致了在谁有权获 得线上教育平台产生的数据及这些数据应当如何被使用的问题上备受争议。对于这类教育记 录,家庭教育权和隐私法案(“Family EducationalRights and Privacy Act,FERPA)、保 护学生权利修正案(“Protection of Pupil Rights Amendment,PPRA)和儿童在线隐私保 护法(“Children s Online Privacy Protection Act,COPPA)中的相关条文在使用过程中者R 会遇到相应的挑战。在大数据时代保护儿童的隐私今天的孩子们是从识字前就接触数字
45、设备的第一代人。在美国,青少年是移动应用与社交平 台上的活跃用户。当他们使用这些科技时,关于他们的精确数据,其中一些甚至包含敏感信 息,就在网络上被存储与处理。这类数据既包含能够大幅度提升孩子的学习效果并为其开启 全新机遇的可能性,但同时,也可能在他们成人时形成一份入侵型的消费者个人信息,或通 过其他方式对他们之后的生活产生影响。虽然年轻人一般与成年人一样乃至更加清醒地意识 到数据会被商业机构与政府部门使用,但他们的数据还是会经常地受到父母、老师、大学招 生人员、军队征兵人员与社会工作者的审查。他们中的弱势群体,包括寄养儿童与无家可归 的年轻人,他们通常没有得到成年人的指导因而特别容易遭受数据
46、滥用与身份盗窃。在强有 力的监视之下,年轻人苦苦寻找保护他们隐私的方法,即使他们无法限制别人对于分享内容 本身的获取,许多年轻人仍然尝试着用多种方式将所分享内容的含义变得模糊、晦涩,使得 只有特定的对象才能理解其中的意思。因为年轻人是那么的年轻,他们需要适当的自由来探索与尝试而不至于因一时的疏忽在日后 受到挥之不去的侵扰。儿童在线隐私保密法要求网站运营商与移动应用开发者在收集低于 13周岁的儿童的个人信息时必须征得其父母或监护人的同意。而现在,我们对于儿童正在 遭受什么“伤害”以及怎样的政策框架才能确保他们伴随技术成长是一种促成而不是阻碍都 还没能得出一个确定的结论。与医疗保健一样,青少年在与
47、数字教育平台的交互中表现出的部分数据是极其私密的个人信 息,这些数据包括对于特定学习方式的偏好和他本人相对于其他学生的表现。它甚至能够分 辨出有学习障碍或注意力无法长时间集中的学生。根据学生在一天内的上线与在线时间,他 个人的生活习惯甚至都可以被获知。教育机构应当如何使用这类数据来改善学生的学习机 会?对于使用这些平台的,特别是处于基础教育阶段的学生,他们如何能够保证自己的数据 是安全的?为了回答关于这些数据的所有权与恰当使用方式的复杂问题,教育部于2014年2月公布了 针对在线教育服务指南。指南明确指出,只有满足家庭教育权和隐私权法案与保护学 生权利修正案中规定的具体要求,学校或学区才可以才
48、能够与第三方机构签订涉及学生数 据的协议。随着越来越多的线上学习工具和服务可以为孩子们所使用,州与地区政府也正密 切地关注着这些问题。学校与学区以未来合法的教育效益为目的共享受到保护的学生信息, 并且在分享的过程中必须对这些信息保持“直接控制:即使在这新的指导之下,如何在大 数据世界中最好地保护学生隐私仍必须是一个持续的议题。当局正致力于解决这些问题,并通过教育部加以实施,来使得所有的学生在享受大数据在教 育与学习上带来的创新效益的同时免于受到其潜在威胁所带来的伤害。正如教育部长阿 恩邓肯(Arne Duncan)所说:“学生数据必须是安全且珍贵的,无论它存储在何处,它都不 是一种商品。”这意味着必须确保学生的个人信息与在线活动不受到不恰当的使用,尤其当 这些信息是在教育环境下被收集的。大数据在国土安全部每一天,有两百万人次乘坐飞机穿梭于美国上空,超过一百万人通过陆路进入国内。验证每 一个人的身份并确定他或她是否会构成威胁的工作落到了国土安全部(u Department of Homeland Security , DHS)的头上,后者必须在数秒内处理大量的数据来完成这项职责。 这项工作不仅仅是从一个“草垛”中寻找一根“针头”,保护我们居住的家园往往需要从许 许多多的“草垛”中找出那根最为关键的“针头”个典型的大数据问题。确保国土安全部有效而合法地使用它搜集的信息是项艰巨