《(5.8.6)--中国地方政府数据开放报告(2020上半年).pdf》由会员分享,可在线阅读,更多相关《(5.8.6)--中国地方政府数据开放报告(2020上半年).pdf(71页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、123引言 数林概貌 数林指标 数林指数 数林标杆 数林建言 评估方法 附录 00400601001601905806106745“中国开放数林指数”和中国地方政府数据开放报告是我国首个专注于评估政府数据开放水平的专业指数和报告,由复旦大学数字与移动治理实验室制作出品,复旦大学和国家信息中心数字中国研究院联合发布。“开放数林”意喻我国政府数据开放利用的生态体系,自 2017 年 5 月首次发布以来,定期对我国地方政府数据开放水平进行综合评价,精心测量各地“开放数木”的繁茂程度和果实价值,助推我国政府数据开放生态体系的培育与发展。2018 年以来,中国开放数林指数为国家互联网信息办公室信息化发展
2、局跟踪监测我国公共信息资源开放情况提供数据支撑。2019 年以来,报告被收录进复旦智库报告系列,成为复旦大学每年重点推出的 15-20 份有社会影响力的报告之一。开放数据,蔚然成林,一棵棵地方开放“数木”由最初的丛然并生、成荫如盖,直至枝繁叶密、花开结果,终将成长为一片茂盛多样、枝杈相连、循环持续的中国“开放数林”。引 言67截至 2020 年 4 月底,我国已有 130 个省级、副省级和地级政府上线了数据开放平台,其中省级平台 17 个,副省级和地级平台 113 个(如图 1)。与 2019 年下半年相比,新增 28 个地方平台,包括 1 个省级平台和 27 个地级(含副省级)平台。一、数林
3、概貌 图 1 我国地方政府数据开放平台上线情况334101520561021302012年2013年2014年2015年2016年2017年2018年2019年2020上半年8 表 1 各地平台上线时间一览表目前,我国 54.83%的省级行政区(不包含港澳台)、73.33%的副省级和32.08%的地级行政区已推出了政府数据开放平台。地级以上平台数量迅速增长,从2017 年的 20 个,到 2018 年的 56 个,到 2019 年的 102 个,再到 2020 上半年的130 个。“开放数据,蔚然成林”的愿景已初步实现,政府数据开放平台日渐成为地方数字政府建设和公共数据治理的标配。9截至 20
4、20 年 4 月,全国各地上线的省级政府数据开放平台的地区分布如图 2 右所示,颜色越深代表平台上线时间越早。从整体上看,我国地方政府数据开放平台呈现出从东部地区向中西部地区不断扩散发展的趋势,东南沿海地区的省级平台已经基本相连成片。截至 2020 年 4 月,副省级和地级政府数据开放平台的地区分布如图 3 右所示,颜色越深代表平台上线时间越早。目前,广东省、山东省和浙江省内的绝大多数地市都已上线了政府数据开放平台,形成我国最为密集的省级“开放数林”。同时,在东中部地区的江苏、安徽、湖北和江西以及西南地区的贵州和四川等地,地级平台也不断上线并逐渐相连成片。图 2 各地平台上线时间的地理空间分布
5、(省级)图 3 各地平台上线时间的地理空间分布(副省级和地级)10112.1 评估指标体系的构建方法开放数林指数邀请国内外政界、学术界、产业界共七十余位专家共同参与,组成“中国开放数林指数”评估专家委员会,体现了跨界、多学科、第三方的专业视角。专家委员会基于数据开放的基本理念和原则,借鉴国际数据开放评估指标体系的经验,立足我国政府数据开放的政策要求与地方实践,结合专家研讨与赋值,构建起一个系统、科学、可操作的地方政府数据开放评估指标体系,并为每项指标分配了权重(见图 4)。二、数林指标 图 4 开放数林指数评估指标体系的构建方法12 图 5-1 2020 中国开放数林指数评估指标体系评估指标体
6、系共包括准备度、平台层、数据层、利用层四个维度及下属多级指标(见图 5):13准备度是“数根”,是数据开放的基础,包括法规政策效力与内容、组织与实施、标准规范制定等三个一级指标。平台层是“数干”,是数据开放的枢纽,包括数据发现、数据获取、成果提交展示、互动反馈、用户体验等五个一级指标。数据层是“数叶”,是数据开放的核心,包括数据数量、数据质量、数据规范、开放范围等四个一级指标。利用层是“数果”,是数据开放的成效,包括利用促进、有效成果数量、成果质量、利用多样性等四个一级指标。图 5-2 2020 中国开放数林指数评估指标体系142.2 评估指标体系的主要变化整体上,利用层的权重从 15%进一步
7、提升到 20%,准备度权重则相应从 25%下调到 20%,我国地方政府数据开放已发展到了一个更为成熟的阶段,因此评估的重点也将从准备基础向实际成效倾斜。数据层和平台层的权重保持不变,数据层作为数据开放的核心维度,权重仍保持在 40%,平台层的权重也仍旧为 20%。准备度:将地方公布的政府数据开放相关法规政策的效力和内容进行综合评估。在法规政策内容上,更加侧重对数据开放的范围、目录、质量等方面的要求,更加强调对数据开放全生命周期安全管理的要求。进一步提高了“发布实施细则和公布工作计划”与“标准规范制定”的权重,为数据开放工作的落地提供更有效、更具操作性的支撑。平台层:更加重视平台与用户之间的“互
8、动反馈”,强调平台应注重日常运营而不仅仅是功能设置。因而,将平台对用户提出的对有条件开放数据的申请、对未开放数据的请求、意见建议和数据纠错等要求进行回复与公开的权重进一步提升。在联系方式的提供上提高了要求,强调不仅应提供平台的联系方式,还应公布各个“数据集”的提供者的联系方式,使平台真正成为一个能让数据的供需双方直接实现对接的枢纽。此外,还提升了个性化服务的权重,新增了“平台互联互通”和“包容性功能”等指标。数据层:在数据数量和容量的计算上,首先对数据集的有效性进行检验。增加了对“省域”数据数量的评估,将省级下辖地市所开放的有效数据集的数量和容量按一定比例折算入省级得分,以体现省级地方对下属地
9、市数据开放工作的推进和赋能作用。数据质量的比重进一步提升,重点对存在高缺失、碎片化、低容量、生硬格式转化等质量问题的数据集进行检测。在数据规范上,强调需对不同类型的数据集提供差异化的开放授权协议。在开放范围上,依据 2020 年 4 月中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见中的相关要求,增加了对企业登记、交通运输、气象等关键数据集的评测;还根据今年新冠疫情暴发以来社会对疫情数据开放的需求,也将疫情防控类数据列入了关键数据集。15利用层:在利用促进上,新增了“引导赋能活动”指标,鼓励各地在组织综合性的开放数据大赛之外,也开展多种形式的常态化、条线性、专业性的引导赋能工作。
10、在有效成果数量上,增加了对“省域”成果数量的评估,将省级下辖地市所产生的有效利用成果的数量按一定比例折算入省级得分。成果质量的权重也进一步得到提升,并鼓励各地平台清除与数据开放无关的成果、由政府自身开发的成果和不可用的成果。进一步提高了“无数据来源不明”这项指标的权重,鼓励各地为展示的利用成果标明其所利用的开放数据的名称。此外,还增加了“利用多样性”这项指标,包括数据利用者、成果形式和主题领域的多样性。1617报告评选出了省级开放数林综合指数排名前十和地级(含副省级)综合指数排名前二十的地方作为标杆,推介给其他地方进行对标分析和学习。省级开放数林指数综合排名前十的地方的分值、排名与等级如表 2
11、 所示。在 2020 年上半年的省级排名中,浙江和上海的综合表现最优,进入第一等级“五棵数”。山东表现优异,进入第二等级“四棵数”,其次是广东、贵州、北京等地。地级(含副省级)开放数林指数排名前二十的地方的分值、排名与等级如表3所示。在 2020 年上半年的地级(含副省级)排名中,深圳、贵阳的综合表现最优,进入第一等级“五棵数”,其次是宁波、烟台、济南、福州、成都,进入第二等级“四棵数”。三、数林指数 表 2 省级综合排名前十18 表 3 地级(含副省级)综合排名前二十宁波、绍兴在半年来新上线平台的地方中综合指数表现最佳。山东和烟台相比上一期排名的进步幅度最大。在四个单项维度上,上海在准备度和
12、平台层两个单项上排名第一,浙江在数据层单项上排名第一,深圳在利用层单项上排名第一。1920本章将重点推荐政府数据开放的标杆地方及其优秀实践,以供各地进行对标分析,不断完善和提升本地的政府数据开放体系和能力。四、数林标杆4.1 准备度4.1.1 法规政策效力与内容法规政策是指对政府数据开放各个重要方面做出规范性要求的法律、行政法规、行政规章、部门规章、地方性法规、地方政府规章以及各种规范性文件,是推进政府数据开放的法制基础和重要依据。在法规政策的效力上:上海和浙江分别在 2019 年 8 月和 2020 年 6 月出台了专门针对公共数据开放的地方政府规章,即上海市公共数据开放暂行办法和浙江省公共
13、数据开放与安全管理暂行办法,文件等级和专门性相对较高。其他一些地方也出台了专门针对数据开放的规范性文件,如北京市交通出行数据开放管理办法(试行)和福州市公共数据开放管理暂行办法等。图 6 上海市人民政府令第 21 号21在对数据开放的范围和质量等方面的要求上:浙江在暂行办法中作出了规定,如表 4 和表 5 所示。图 7 浙江省人民政府令第 381 号 表 4 浙江省公共数据开放与安全管理暂行办法中对开放数据范围的要求22 表 5 浙江省公共数据开放与安全管理暂行办法中对数据质量的要求 表 6 上海市公共数据开放暂行办法中对数据获取方式的要求在对数据开放方式的要求上:上海和浙江的暂行办法提出应当
14、对不同开放类型和属性的数据采用差异化的数据获取方式,如表 6 和表 7 所示。23 表 7 浙江省公共数据开放与安全管理暂行办法中数据获取方式的要求24在对数据进行开发利用的要求上,上海、浙江和福州等地的法规政策都对生态培育建设作出了规定,如表 8 所示。表 8 对数据开放生态培育的要求25在对数据开放进行全生命周期安全管理的要求上,上海和浙江等地对开放前的数据审查、事中安全管控、开放后行为处理的方式与措施都作出了详细规定。浙江省公共数据开放与安全管理暂行办法的第十三条对开放前评估和审查作出了具体规定,如表 9 所示。上海市公共数据开放暂行办法中对预警机制、应急管理等作出了明确规定,如表 10
15、 所示。表 9浙江省公共数据开放与安全管理暂行办法中对数据开放前审查的要求 表 10上海市公共数据开放暂行办法中对事中安全管控方面的要求26上海对数据利用主体的违法违规行为处理做出了规定,如表 11 所示。表 11上海市公共数据开放暂行办法中对开放后行为处理方面的要求 表 12上海市公共数据开放暂行办法中对关于专人专岗管理制度的描述 表 13 浙江省公共数据开放与安全管理暂行办法中对资金保障的描述在对保障机制的要求上,上海提出应当建立数据开放专人专岗管理制度,如表12 所示。浙江对资金保障作出了明确要求,如表 13 所示。274.1.2 组织与实施组织与实施是指对政府数据开放工作的组织保障与推
16、进实施。政府数据开放工作主管部门的机构职能和行政层级对其推动工作的力度和效果至关重要,浙江和广东等地的政府数据开放主管部门为省政府办公厅管理的省政府机构,有利于数据开放工作的开展,如表 14 所示。表 14 浙江和广东的政府数据开放主管部门及其职能28 表 15 地方领导讲话内容自 2018 年 1 月以来,上海、浙江和成都等地的高层领导就政府数据开放作了较为丰富全面的公开讲话,有利于推进当地的政府数据开放工作,如表 15 所示。29 表 16 各地方数据开放年度计划、工作方案 表 17 山东、江西、浙江、广东、上海专门针对数据开放的标准规范4.1.3 标准规范制定制定开放数据标准规范和操作指
17、南,有利于数据开放工作的标准化和规范化实施。目前山东、江西、浙江、广东、上海均已制定了专门针对数据开放的地方标准或技术规范(如表 17 所示)。上海、深圳和福州连续制定和公开了专门针对政府数据开放的年度工作计划。30浙江省公共数据开放技术规范对开放数据标准、开放平台功能和平台管理都作出了明确的规定。山东省对各级政务部门的数据开放、数据脱敏以及数据开放程度评价工作均制定了标准。江西省政务数据开放平台技术规范对开放数据集元数据、平台技术架构和平台要求进行了规范。广东省在数据资源开放的技术规范和管理规范上都制定了标准。上海市公共数据开放分级分类指南(试行)对数据开放的范围、分类分级作出了规定。4.2
18、 平台层4.2.1 数据发现政府数据开放平台用醒目的方式展现数据,有助于用户了解发现和获取目标数据集。在最新动态方面,上海平台在首页展现了最新数据集、最新 API、最新 APP 和最新资讯(如图 8)。图 8 上海平台首页展现的最新动态31在数据导引方面,深圳、山东、浙江等平台提供了可下载的开放数据目录,上海等平台的分类按照用户使用场景进行分类导航,四川、贵阳等平台提供了有多个筛选项的高级搜索功能,浙江等平台则提供了数据集预览功能,深圳等平台还推荐了相关数据集和展示了基于开放数据集开发的应用(如图 9、图 10、图 11、图 12、图 13所示)。图 9 深圳平台的开放数据目录32 图 10
19、上海平台的场景式分类导航 图 11 四川平台的高级搜索功能33 图 12 浙江平台的数据集预览功能 图 13 深圳平台的相关数据推荐和相关应用关联功能344.2.2 数据获取数据获取是指平台为用户获取不同类型的数据集提供了便捷的功能。在无条件开放数据获取方面,上海、浙江、福州和贵州等平台提供了差异化的数据获取方式,部分数据集用户无需登录便可获取,其他数据集需要登录才可获取。在有条件开放数据申请方面,上海和深圳平台已为部分数据集开设了申请功能,并能对用户提出的申请进行及时有效的回复(见图 14、图 15)。图 14 上海平台的有条件开放数据申请功能35 图 15 深圳平台对有条件开放数据申请的回
20、复 图 16 上海平台对未开放数据请求的回复在未开放数据请求方面,上海、浙江、宁波不仅提供了对未开放数据的请求(如图 16),而且对用户的数据请求进行了及时有效的回复。此外,四川和绍兴对部分用户还会进行及时详细的电话回复。364.2.3 成果提交展示成果提交展示是指平台为数据利用者开设了提交和展示其利用政府开放数据所产生的各类成果的功能,从而既便于公众在平台上发现和使用数据利用成果,也有助于政府了解开放数据的利用情况和效果。在利用成果提交方面,浙江等平台开通了多种利用成果的提交渠道(如图 17 所示)。图 17 浙江平台的利用成果提交37在利用成果展示方面,绍兴等平台展示了多种类型的数据利用成
21、果,并标注了利用成果的来源信息(如图 18 所示)。图 18 绍兴平台的利用成果展示 图 19 浙江平台的数据集发布者联系电话4.2.4 互动反馈互动反馈是指政府数据开放平台提供了便于用户与平台或数据提供方进行沟通反馈的功能。在数据集发布者联系方式方面,浙江平台公布了数据集发布者的联系方式(如图 19)。38在用户评价、意见建议和数据纠错方面,上海平台和贵阳平台对用户提出的意见建议进行了及时有效的回复(如图 20、图 21 所示);绍兴对部分用户的意见建议进行了电话回复。上海对用户提出的数据纠错要求进行了及时详细的回复(如图22)。图 20 上海平台对意见建议的回复 图 21 贵阳平台对意见建
22、议的回复394.2.5 用户体验用户体验是指平台为便于用户使用平台所提供的功能,例如平台互联互通、个人账户、个性化服务和包容性功能。在平台互联互通方面,贵州等平台提供了省内平台和国内其他数据开放平台的链接(如图 23 所示)。图 22 上海平台对数据纠错的回复 图 23 贵州平台提供的其他平台链接40在个人账户体验方面,广东等平台提供了包括个人注册和法人注册的账户分类注册,且在个人注册时要求必须填写的个人信息最少,使用户可便捷地注册账户(如图 24、图 25 所示)。图 24 广东平台个人账户注册 图 25 广东平台法人账户注册41在个性化服务方面,上海和浙江等平台提供了包括收藏管理、互动反馈
23、管理、推送功能在内的个性化功能,如图 26 所示。在包容性功能上,为方便各种不同类型的群体(如老年人等)使用平台,济南平台推出了“信息无障碍通道”,体现了平台的包容性,如图 27 所示。图 26 浙江平台的个性化服务 图 27 济南平台的“信息无障碍通道”424.3 数据层4.3.1 数据数量数据集是指由数据组成的集合,通常以表格形式出现,每一“列”代表一个特定变量,每一“行”则对应一个样本单位。截至 2020 年 4 月,烟台、潍坊、上海开放的有效数据集的总数最高,均开放了超过了三千个数据集(如图 28)。数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数
24、)乘以条数(行数)后得出的数据总量。截至 2020 年 4 月,浙江、佛山和烟台平台开放的有效数据集的容量最高;山东、广东与浙江的省域数据容量最高。4.3.2 数据质量数据容量大、社会需求高的优质数据集是开放数据的重点。报告对国内各地平台上所有可下载的数据集(共约 46797 个)按照数据容量进行排序,在数据容量相同的情况下再按照下载量排序,最终选出排名居于前 1%的数据集作为优质数据集(共约467 个)。优质数据集数量前十的地区如图 29 所示,烟台和浙江开放的优质数据集的数量相对最多。图 28 国内各地平台有效数据集数量(前十名)369734243344263225522273224517
25、6916961585烟台潍坊上海贵阳青岛济南深圳临沂贵州成都43表18是排在前十位的优质数据集列表,这些数据集普遍具有较高的条数和字段数,内容主要涉及商事主体、交通运输、医疗、司法、城市管理等方面。图 29 国内各地平台优质数据集数量(前十名)表 18 前十位优质数据集列表7462373226251515149烟台浙江深圳上海广东佛山北京贵阳山东济南44相对而言,存在数据质量问题较少的地方如表 19 所示。高缺失数据集是指数据集中有 60%以上的空缺数据;碎片化数据集是指按照时间、行政区划、政府部门等被人为分割的数据集,不利于数据的融合利用;低容量数据集是指因数据量本身稀少或颗粒度过大等原因造
26、成的数据条数在三行或三行以内的数据集,其再利用价值较低;生硬格式转化是指平台将非结构化的 DOC、PDF 等文件生硬地转化成 XLS、CSV、XML等可机读格式。在开放数据持续性上,广东、深圳、贵阳能够每季度持续开放新的数据集,山东、上海与浙江等地能对平台上的大多数已开放数据集保持动态更新。4.3.3 数据规范开放授权协议是指以契约的形式确定数据开放主体和数据使用者之间关于数据利用的权利义务关系,有利于保障和规范数据的合理使用。山东平台率先为单个数据集提供了开放授权协议(如图 30 中的数据使用许可),而不是整个平台使用同一个通用的授权协议。绍兴平台在用户下载数据时提供开放授权许可使用协议(如
27、图 31)。表 19 存在数据质量问题较少的地方 图 30 山东平台为每个数据集提供数据使用许可45 图 31 绍兴平台在用户下载数据集时提供开放授权许可使用协议山东、浙江、广州、深圳和福州等地方平台为开放的各个数据集提供了可机读格式和非专属格式,福州、山东和深圳平台提供了相对规范 RDF 格式(如图 32)。RDF格式(资源描述框架)作为 W3C 的推荐标准,使用了“主体谓词客体”三元组形式来描述数据资源和它们之间的关系,使数据资源更易于被机器阅读和理解,每一条数据都是一个唯一的资源 URI,有助于数据利用者发现和链接相关数据资源。46 图 32 福州平台为数据集提供了相对规范的 RDF 格
28、式在 API 接口的开放性上,北京和福州平台开放的 API 接口的申请和调用难度相对较低。在描述说明方面,福建、广东、山东、浙江、深圳等地方平台在基本元数据和 API 描述方面较为完整。4.3.4 开放范围开放多个主题领域的数据集有利于提高数据开放的广度,开放数据的部门覆盖面则反映了各个政府部门的参与程度。在数据开放范围上,北京和广州平台开放的数据集覆盖了所有重要主题与主要部门。报告对各地平台上开放的所有数据集名称进行文本分析,发现了一批高频出现的能描述数据领域和内容的关键词,并基于这些关键词回溯到相应的数据集,梳理得出各地平台上十四类常见数据集(见表 20)。47报告还基于中共中央 国务院关
29、于构建更加完善的要素市场化配置体制机制的意见和地方政策规章中要求重点和优先开放的数据领域,结合各地平台上已开放的优质数据集清单,建议各地优先开放以下五项关键数据集(见表 21)。目前,北京、山东、上海、青岛和济南等地方平台上开放了所有的常见数据集;深圳平台开放了所有五项关键数据集。北京、山东、深圳、济南、青岛等地方平台率先开放了疫情防控类数据,包括疫情发展情况数据、疫情诊疗数据、疫情防控数据、疫情期间城市运营数据等方面。表 20 常见数据集列表48 表 21 关键数据集列表4.4 利用层4.4.1 利用促进利用促进是指政府为了推动开放数据的社会化利用而组织的各类活动。组织开放数据创新利用比赛是
30、一种常见的利用促进活动,各地自 2018 年以来举办的部分开放数据创新利用比赛如表 22 所示。其中,上海、山东、北京、海南、深圳、绍兴、潍坊等地连续举办开放数据比赛,上海开放数据创新应用大赛(SODA)自 2015 年以来,已连续举办 6 届,成为数据开放领域的品牌赛事。49 表 22 地方举办的开放数据创新利用比赛在比赛类型上,既有综合性大赛,如 2020 浙江数据开放创新应用大赛和深圳开放数据应用创新大赛(如图 33);也有更具行业性和专业性的比赛,如上海市已连续四年举办了图书馆开放数据专项竞赛(如图 34)。50 图 33 浙江省 2020 数据开放创新应用大赛 图 34 2020 上
31、海图书馆开放数据竞赛51在比赛的组织形式上,浙江和四川等省的数据利用大赛设置了多个地市分赛区。2020 首届数字四川创新大赛在德阳、宜宾、达州、雅安等地市都设置分会场(如图35)。开展各种常态化、条线性、专业性的引导赋能活动,也有助于促进开放数据的利用和落地。上海市举办了公共数据开放应用试点项目申报政策宣讲会、应用试点项目征集宣贯会等引导活动,深圳市也举办了 2020 开放数据应用创新大赛才企交流活动。上海市推出普惠金融应用(如图 36),整合 8 个部门的数据,开放了 300 多个数据项,为银行信贷赋能;浙江省金华市搭建信义贷金融服务平台(如图 37),为银行发放贷款提供数据支持。图 35
32、2020 首届数字四川创新大赛52 图 36 上海市数据开放普惠金融平台53 图 37 金华市信义贷金融服务平台544.4.2 有效成果数量在社会利用开放数据产生的有效成果数量上,浙江、贵州、山东、贵阳、深圳等地平台上展示的有效成果相对较多。深圳和山东等地还展示了利用疫情开放数据产出的成果。深圳平台展示的应用“城市疫情场所地图”(如图 38),标注了出现疫情的场所,对市民进行风险提示。图 38 深圳平台展示的“城市疫情场所地图”554.4.3 成果质量在成果质量上,浙江、贵州、贵阳、深圳等地平台上展示了较为优质的利用成果。如:浙江平台展示的高德地图(停车场板块)(如图 39),为市民提供停车指
33、引。除此之外,浙江的人人巴士,贵州的货车帮、贵健康,贵阳的慧停车(如图 40),深圳的小区罗盘等利用成果也相对质量较高。图 39 浙江平台展示的高德地图(停车场板块)图 40 贵阳平台展示的慧停车564.4.4 利用多样性利用多样性是指开放政府数据利用者类型、成果形式和覆盖主题的多样性。在利用者多样性上,山东和贵阳等平台展示了较为丰富多样的数据利用者类型,包括企业、个人、高校与研究机构等。在利用成果形式的多样性上,山东平台展示了服务应用、研究成果、创新方案等多种类型的利用成果(如图 41)。图 41 山东平台对多类开放数据利用成果进行了分类展示57在利用成果覆盖主题的多样性上,深圳平台上展示的
34、利用成果主题覆盖面较广,包括卫生健康、交通出行、城建住房等领域(如图 42 所示)。图 42 深圳平台展示了多个主题的利用成果58595.1 数根:政策供给与组织保障 制定有利于促进和规范政府数据开放的地方性法规、地方政府规章或规范性文 件,并对数据要求、开放方式、开发利用、全生命周期安全管理、保障机制等 作出明确的规定。地方党政领导加大对政府数据开放的支持力度。制定和公开政府数据开放实施细则与年度工作计划。制定和公开具有指导性和操作性的有关政府数据开放的标准规范。5.2 数干:常态运营与功能优化 保障平台的常态化运营,让用户“获取数据有着落,联系平台有回应”。提供可下载的开放数据目录,以用户
35、视角帮助其发现数据,在搜索功能中提供 多种筛选条件。提供分级分类获取数据的方式,对于有条件开放类数据列明条件,开通申请入 口,并及时有效地回复用户提出的申请;对于未开放的数据,开通提出请求的 入口,并及时有效地回复用户需求。提供提交和展示数据利用成果的功能,并展示利用成果的数据来源。提供数据集发布者的联系方式,对用户做出的评价和提出的意见建议与纠错要 求进行及时有效的回复。加强同相关数据开放平台的互联互通,提升用户注册账户的便捷度,提供个性 化服务和包容性功能。五、数林建言605.3 数叶:容量提升与质量优化 提升有效数据集的数量与容量,开放高容量、高需求的优质数据集,特别是以 API 接口形
36、式开放的动态的、大容量的数据集。减少高缺失、碎片化、低容量的数据集,保持开放数据集的不断增长和动态更新。推进数据的分级分类开放,对数据集标注不同的开放类型和属性,并相应配备 差异化的开放授权协议。提高开放数据集可机读格式、非专属格式、RDF 格式的比例,降低申请和调用 API 接口的难度,为开放数据集提供丰富的元数据信息和详细的使用指南。提高开放数据集的主题覆盖面和部门覆盖面,开放更多常见数据集和关键数据集。5.4 数果:数据利用与生态培育 促进数据在开放之后的开发利用,包括综合性的开放数据利用比赛和条线性的 引导赋能活动,营造有利于政府数据开放利用的生态体系。提高有效利用成果的数量和质量,清
37、理与数据开放无关的、由政府自身开发的、无法获取或无法正常使用的成果,为展示的利用成果标明其所利用的开放数据 集并提供链接。提高开放数据利用者的多样性,提升利用成果形式与主题领域的多样性。61626.1 评估范围指数出品方根据公开报道,以及使用“数据开放”“数据公开”“公共数据”“政务数据”“政府数据”“地名数据”“地名政府数据”“地名开放数据”等关键词进行搜索,发现了截至 2020 年 4 月我国已上线的地方政府数据开放平台,并从中筛选出符合以下条件的平台:1、原则上平台域名中需出现 ,作为确定其为政府官方认可的数据开放平台的依据。2、平台所代表的地方政府的行政级别为地级及以上。3、平台形式为
38、“集中专有式”或“集中嵌入式”。“集中专有式”是指开放数据集中汇聚在一个专门的平台上进行开放;“集中嵌入式”是指开放数据统一汇聚为一个栏目版块,嵌入在政府门户网站或政务服务网站上。各个条线部门建设的非集中式开放数据的平台不在指数的评估范围内。本次评估中,指数出品方共发现符合条件的地方平台130个,其中省级平台17个,地级(含副省级)平台113个,将上线了这些平台的地方作为本次评估的对象。具体地方、平台名称和平台域名如表 23 所示。六、评估方法 表 23 评估范围(按行政层级及拼音首字母排序)6364656.2 标杆地方评选方法报告首先基于数据层中的关键性指标对 130 个地方进行评测,选择评
39、测结果表现靠前的省级与地级(含副省级)地方,然后再对这些地方的准备度、平台层与利用层进行评估,最终评选出省级前十与地级(含副省级)前二十名的标杆地方。6.3 数据采集与分析方法准备度评估主要对相关法律法规、政策、年度计划与工作方案、标准规范、新闻报道等资料进行了描述性统计分析和文本分析。搜索方法主要包括以下两种:一是在百度搜索引擎以关键词检索相关法规与政策文本、标准规范、年度工作计划、有关地方党政领导讲话支持的新闻报道以及数据开放主管部门的信息;二是在地方政府门户网站以及政府数据开放平台上通过人工观察和关键词检索采集数据。评估范围数据采集的截止时间为 2020 年 6 月。66数据层评估主要通
40、过机器自动抓取各地公共数据开放平台上开放的数据,结合人工观察采集相关信息,然后对数据进行了描述性统计分析、交叉分析、文本分析和空间分析。数据采集截止时间为 2020 年 4 月,对“动态更新”这一指标的评测时段为2020 年 1 月 1 日至 2020 年 3 月 30 日一个季度。平台层评估主要采用人工观察法对各地方政府数据平台上各项功能进行观测并做描述性统计分析,数据采集截止时间为 2020 年 6 月。同时,指数出品方还对平台的回复情况(包括回复时间和回复质量)进行了评估,回复情况采集截止时间为 2020 年6 月。利用层评估主要对各地公共数据开放平台上展示的利用成果进行了人工观察和测试
41、,对 2018 年以来各地开展的开放数据创新利用比赛信息进行了网络检索,并对采集到的数据进行了描述性统计分析。数据采集截止时间为 2020 年 6 月。6.4 指标计算方法指数出品方基于各地在各项评估指标上的实际表现从低到高按照 0-5 分共 6 档分值进行评分,其中 5 分为最高分,相应数据缺失或完全不符合标准则分值为 0。对于连续型统计数值类数据则使用极差归一法将各地统计数据结果换算为 0-5 之分间的数值作为该项得分。各地平台在准备度、平台层、数据层、利用层四个维度上的指数总分等于每个单项指标的分值乘以相应权重所得到的加权总和。最终,各地开放数林指数等于准备度指数、平台层指数、数据层指数
42、、利用层指数乘以相应权重的加权平均分。各地开放数林指数计算公式如下:各地开放数林指数6768指数出品团队郑磊、刘新萍、张忻璐、吕文增、华蕊、韩笑、侯铖铖、张宏、黄铎宾观察员艾文华、曾翔、陈梦凡、房海旭、胡蝶、连莹、黄锦坚、钱宇霆、任冉冉、舒蔚兰、王搏维、王叶青、王野然、王昭文、文可昕、谢琪、徐丹丹、许怡婷、姚慧、岳景旸、赵碧凡、周彩玲报告校对组纪昌秀、王翔、董煜、魏以宁、叶俊宏、陈欢、孙一蕾、方金传指数出品方69评估专家委员会70联合发布方合作单位冥睿(上海)信息科技有限公司汇纳科技股份有限公司DataMate 数据工作室晴禾(南京)文化有限公司浪潮集团复旦发展研究院中山大学数字治理研究中心上海市静安区人力资源和社会保障局71