《DB3212_T 1148-2023 公共数据平台运行维护规范.docx》由会员分享,可在线阅读,更多相关《DB3212_T 1148-2023 公共数据平台运行维护规范.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、ICS35.020CCSL70DB3212泰州市地方标准DB3212/T11482023公共数据平台运行维护规范Commondataplatformoperationandmaintenancespecification2023-12-31发布2024-01-31实施泰州市市场监督管理局发布DB3212/T11482023前言本文件按照GB/T1.12020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由泰州市大数据管理局提出、归口并组织实施、监督。本文件由泰州市大数据管理局负责具体技术内容的解释。
2、本文件起草单位:泰州市大数据管理局、泰州市标准化院。本文件主要起草人:孙慧、赵文涛、张婧娴、王小冬、陈书剑、刘小芳、梁鑫晨、吴薇、陈蓝生、王友成、郭健、李海鹏。IDB3212/T11482023公共数据平台运行维护规范1范围本文件规定了公共数据平台(简称平台)运行维护内容和流程的要求。本文件适用于公共数据平台的运行维护。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T21061国家电子政务网络技术和运行管理规范GB/T222392019
3、信息安全技术网络安全等级保护基本要求GB/T28827.4信息技术服务运行维护第4部分:数据中心服务要求GB/T35293信息技术云计算虚拟机管理通用要求GB/T37736信息技术云计算云资源监控通用要求3术语和定义3.13.23.33.4下列术语和定义适用于本文件。故障accident平台运行过程中发生的不能正常执行规定功能的状态,导致整个系统功能、性能恶化的事件。突发事件emergency突然发生的、未曾预防的、需要立即处理的紧急事件、灾害事故等。快照snapshot某一时间点磁盘数据状态的备份文件,用于数据备份、恢复。运行维护operationandmaintenance为适应平台环境和
4、其他因素的各种变化,保证平台的正常工作,而对平台功能的改进或解决平台在运行期间发生的问题所进行的操作,简称运维。4基本要求4.1运维体系应覆盖公共数据平台运行的全过程,并制定持续运行、维护计划。4.2运维团队应满足公共数据平台业务的需要,人员岗位与执业资格应符合运行维护要求。4.3运维应识别数据平台潜在的风险,制定风险预防措施,并组织演练。4.4运维应在确保数据平台可用性和可靠性不受影响的前提下,实现节能减排。5管理框架运维服务管理框架见图1,框架包括以下内容:a)运维事项:包括事件管理、问题管理、变更管理、发布管理和配置管理;1DB3212/T11482023b)运维服务:包括云资源运维管理
5、、机构与账号管理、技术支持服务、机房运维管理和网络运维管理;c)运行保障:包括人员管理、制度管理、资产管理、文档管理和值班管理;d)安全管理:包括网络安全管理、云资源安全管理、数据安全管理和运维安全管理;e)应急管理:包括应急准备、应急处置。图1运维服务管理框架图6运维事项6.1事件管理应为恢复平台提供服务,减少对业务不利影响,尽可能确保最佳的服务质量和可用性级别,并包括以下要求:a)建立事件管理流程,包括事件记录、分级、上报、分派、处理和结束;b)记录运维过程中发生的事件,根据事件的影响程度和影响范围进行评估,上报并根据优先级及时处理;c)对事件响应、处理、结束等过程进行跟踪、督促及检查;d
6、)定期回顾、分析事件处理记录,并完成事件分析报告;e)将运维过程中重复发生的事件、重大事件纳入问题管理。6.2问题管理应分析被列出问题的事件根本原因,找出解决方案,将事件影响最小化,预防问题和事故的再次发生,将未能解决的事件的影响降低到最小,并包括以下要求:a)建立问题管理制度,规范问题的记录、分析和解决的过程;b)对问题的处理过程进行跟踪和管理,包括问题的识别、提交、分析、处理、升级、解决、结束;c)将监控、分析、自查、检查、测评、评估和事件处理中发现的问题进行汇总,并纳入问题库。6.3变更管理应确保平台的有关变更得到评估、审核、实施,保证平台服务在干扰最小情况下实现有益变更,并包括以下要求
7、:a)建立系统变更流程,包括变更申请、审批、执行、测试等;b)对变更进行分类和记录,评估变更请求风险、影响;c)明确系统变更中的角色,至少包括申请人、审批人、实施人、复核人;d)变更申请人编写变更方案,提交变更申请,方案内容包括目标、对象、时间、人员、紧急程度、操作步骤、测试验证、风险防控措施、应急预案、回退措施等;2DB3212/T11482023e)变更审批人根据业务和技术风险进行变更审批,确定变更实施时间,并保存审批记录;f)实施人按照变更方案实施变更,并及时更新配置库;组织变更前后的测试,并提交测试记录或报告;g)变更复核人对变更记录和变更结果进行评估,评估内容包括变更目标的完成情况、
8、对生产环境的影响等。6.4发布管理管理发布到平台实际环境的新增或修改后的配置项的流程,保障平台所有组件的安全性、可用性及运行环境的完整性,应包括以下要求:a)由变更管理触发生成发布请求,根据发布请求制定发布方案,方案需明确发布的内容、角色职责分配、发布日期等;b)根据变更实施情况组织人员进行测试,确保发布成功。当测试通过后,更新相关配置信息;c)制定相应的发布回退方案,确保发布失败时可回退到发布前状态。6.5配置管理识别和定义平台基础设施、云操作系统和平台中的相关部件,在配置管理文档或管理库中保持准确的配置信息,确保平台相关的配置项、状态等信息的正确性和完整性,应包括以下内容:a)制定配置管理
9、流程,明确配置管理人员,负责配置管理的规划、识别、控制、验证及审计、状态跟踪等活动;b)建立配置库,对平台的服务器、存储、网络、安全设备,操作系统、云产品等进行管理;c)配置项属性包括编号、名称、类型、维护责任人、运行状态、关联关系,确定所需的工具、资源、配置项定义、配置项标识等;d)配置项的添加、修改、替换、删除应有记录、可追溯;e)定期检查配置库或相关文档,对发现的不一致情况及时纠正,并保存记录。7运维服务7.1机房运维管理机房运维管理应符合GB/T28827.4规定,还应遵循以下要求:a)建立巡检制度,运维人员定期进入机房进行巡检,并做好记录;b)对机房相关设备进行实时监控,并提供事件或
10、故障发生时的相应支持;c)提供优化改善服务,对IDC机房的安全性可靠性升级改善。7.2网络运维管理网络运维管理应符合GB/T21061的规定,还应遵循以下要求:a)监控网络设备状态、网络连通性等运行状态;b)检查并保存网络设备运行日志;c)备份网络、防火墙、入侵检测等设备的配置参数;d)及时处理网络中断、网络设备故障;e)规划网络IP地址,提高互联网与政务外网IP地址利用率;f)配置政务外网与互联网网闸,实现安全跨网访问。7.3云资源运维管理云资源运维管理应符合GB/T35293和GB/T37736的规定,还应遵循以下要求:a)对云资源开通、配置变更、释放等过程的全生命周期进行管理;b)监控云
11、资源的使用情况,在发生告警时及时通知用户,并提供技术支持。7.4智能运维管理3DB3212/T11482023宜具备一体化智能运营维护能力,主动开展异常检测、动态阈值告警、故障根因诊断等工作,支持常态化运维工作的自动化编排调度和批量运维,提高运维智能化水平。7.5机构与账号管理7.5.1机构管理对平台上的政务部门与用户进行管理,根据政务部门的上下级所属关系,制定相对应的审批流程。新建机构的申请,应由人工书面审核后进行创建。7.5.2账号管理7.5.2.1对新申请账号进行人工核实,包括姓名,电话,邮箱和所属机构,核实后开通,并做好记录。7.5.2.2对不使用的账号定期进行清理,对运维人员的账号权
12、限进行分配。8运维保障8.1人员管理8.1.1人员要求8.1.1.1应取得相应的技术能力等级认证,满足平台运维服务的要求。8.1.1.2应参加运维技术、业务、安全等培训,考核合格持证上岗。8.1.1.3应定期参与平台运维技术培训,确保技术能力与平台技术迭代同步。8.1.1.4应保持良好的沟通机制,快速响应用户需求,及时解决使用和故障问题。8.1.1.5应熟悉平台产品的使用方法、问题的解决办法、平台的网络架构及使用规则。8.1.2管理要求8.1.2.1应按运维服务内容,建立运维服务团队,设置相应的服务岗位,配置具备相应技术能力的运维人员。8.1.2.2应建立运维人员培训、岗位考核机制。8.2制度
13、管理8.2.1应建立运维管理的工作机制,制定以下运维管理制度:a)机房管理制度,包括外部施工人员进入机房的审批流程等;b)日常运维管理制度,包括运维操作规程、人员日常操作管理等;c)运维过程管理制度,包括运维各个环节管理、操作流程等。8.2.2应建立运维管理制度制定、发布、维护和更新的机制,定期修订和完善运维管理制度。8.3资产管理8.3.1应建立硬件设备管理制度,包括设备的验证性测试、出入库、安装、盘点、维修(升级)、报废等管理,明确硬件设备管理责任人。8.3.2设备投入使用前,应督促供应商进行必要的验证性测试,并保留测试记录。8.3.3编制平台设备清单,内容至少包括设备名称、设备编号、入库
14、时间、购置时间、设备主要参数、设备序列号、设备状态、设备保修期、设备位置、设备用途等,并保留设备启用、转移、维修、报废等过程的记录。8.3.4应对设备进行标识,并置于设备明显位置。8.3.5应按设备使用年限,定期进行盘点,并对设备状态进行评估和更新。8.3.6应对拟下线和报废设备的存储介质中的全部信息进行清除或销毁。8.3.7应对正式下线设备交指定部门统一管理、保存或处置,并保留相应记录,设备报废应符合有关规定。8.4文档管理8.4.1应对运维服务过程中的记录性文档建立管理制度,并定期更新整理归档保存。4DB3212/T114820238.4.2在运维服务过程中,应对历史故障的现象、原因、处理
15、方法等经验进行收集和分析,记录并形成知识库。8.4.3应建立文档管理制度,管理内容包括但不限于:a)应对文档的分类、命名规则、编写人、审批人、版本、敏感性标识、发布时间、存放方式、修订记录、废止等进行管理,明确文档管理的责任人;b)应对运维过程中涉及的各类文档进行分类管理,可按照制度文档、技术文档、合同文档、资产文档、审批记录、日志记录等进行分类,并统一存放;c)应对文档发布、文档版本进行管理控制。文档应标识敏感性、使用范围、使用权限、审批权限等。文档应能读取、使用最新版本,防止作废文件的逾期使用。8.5值班管理应建立7天x24小时值班制度,明确值班的开始时间、结束时间、交接班时间,设立值班紧
16、急联络人并保持联系电话24小时畅通。8.6供应商管理8.6.1应建立运维服务供应商管理制度,统一管理供应商的运维服务。8.6.2应对运维服务供应商开展资质和能力评估,建立合格供应商名录。8.6.3应签订的服务合同,明确运维服务供应商应承担的责任、义务,并约定服务要求和范围等内容。8.6.4应签署保密协议和承诺书,规定运维服务供应商不得泄露保密信息,承诺服务产品无恶意代码或未授权的功能,不提供违反法律法规的功能模块,并符合电子政务有关技术规范和技术指引。8.6.5在涉及数据交换、数据调用、政务软件产品开发过程中,运维服务供应商应接受政务云管理部门的信息安全检查。8.6.6应定期收集、更新运维服务
17、供应商信息,组织运维服务供应商的服务质量、合同履行、人员工作等内容进行评价,形成评价报告,并跟踪和记录运维服务供应商改进情况。9安全管理9.1网络安全管理网络安全管理应符合GB/T22239-2019中8.1.10.6的规定,还应符合以下要求:a)平台不承载高于其安全保护等级的业务系统;b)不同用户虚拟网络之间进行隔离;c)建立安全防护机制,对网络进行24小时监控,能检测到对客户发起的网络攻击行为,及时封禁攻击来源和记录攻击的类型、时间、流量并进行告警。9.2云资源安全管理云资源安全管理应符合以下要求:a)对于云资源的访问策略需要实行最小化原则,敏感端口需要指定访问源IP;b)定期对云资源进行
18、漏洞扫描,对于存在安全漏洞的云资源应及时告知用户,并协助用户处理。9.3数据安全管理数据安全管理应符合以下要求:a)提供快照服务、快照保护,防止快照中的数据被非法访问或获取;b)云资源应具备多副本备份机制,并且各副本间的数据保持一致;c)提供数据迁移技术支持,保证用户数据迁移的安全、可靠。9.4运维安全管理运维安全管理应符合以下要求:a)建立安全运维制度,运维人员应在指定场所进行工作;b)运维人员账号应实行权限管理,定期修改账号密码;c)对运维专线使用进行管理,非运维人员不得使用运维网络。5DB3212/T1148202310应急管理10.1应急准备应急准备应符合以下要求:a)建立应急处置机构
19、,明确管理、业务、技术等职责;b)建立预防预警机制,制定应急事件报告和通报制度,编制应急响应计划文档等;c)定期针对应急响应计划进行测试、培训和演练。10.2应急处置应急处置应符合以下要求:a)发生突发事件时,立即启动应急响应计划,采取相关措施抑制事件影响,尽快恢复平台正常运行;b)在事件处置结束前,对应急处置人力、物资、技术进行保障,保证事件能够快速有效地按应急响应计划执行;c)按应急事件报告和通报制度及时向组织内外有关方面通报事件处置进展情况;在处置工作结束后,分析总结事件发生原因、现象、损害程度、导致损失等,并形成处置记录。11评价与改进11.1应建立公共数据平台运维的评价机制,对公共数据平台运维的效果进行综合分析与评价,并不断改进。11.2评价可采用自我评价、用户满意度评价、第三方评价或多方评价相结合等方式进行。6