大学数据中心机房运维风险的识别和应对,风险管理论文.docx

上传人:安*** 文档编号:73291489 上传时间:2023-02-17 格式:DOCX 页数:9 大小:20.43KB
返回 下载 相关 举报
大学数据中心机房运维风险的识别和应对,风险管理论文.docx_第1页
第1页 / 共9页
大学数据中心机房运维风险的识别和应对,风险管理论文.docx_第2页
第2页 / 共9页
点击查看更多>>
资源描述

《大学数据中心机房运维风险的识别和应对,风险管理论文.docx》由会员分享,可在线阅读,更多相关《大学数据中心机房运维风险的识别和应对,风险管理论文.docx(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、大学数据中心机房运维风险的识别和应对,风险管理论文摘 要: 高校数据中心机房作为学校重要的场所,为学校日常教学办公提供重要的网络保障。怎样保障数据中心的安全,已经变得越来越重要。本文通过研究风险管理在高校数据中心机房的应用研究。以我校数据中心机房运维项目为例,进行风险管理各方面的研究。旨在提高机房管理人员管理能力,保障数据中心机房安全。 本文关键词语: 风险辨别; 风险应对; 数据中心机房; 数据中心机房是学校数据会聚交互的核心场所,所有接入校园网的数据都是通过数据中心机房进行交互。信息化大背景下,高校数据中心机房为师生提供愈加便捷的服务,在教学、科研、办公等方面都有具体表现出。 近些年来,随

2、着数字校园,智慧校园的推进,全国各高校的数据中心机房规模不断发展。 一表通系统 上线, 最多跑一次 改革,高校越来越多的业务都转到校园网上,办公流程的简化,业务流程的电子化,极大地方便了广大师生。但同时,伴随着不断增长的业务,扩增的机房设备,我们对数据中心的要求不断提升,日常的运维管理面临的风险也越来越大。 1 、高校数据中心运维引入风险管理的意义 数据中心机房是全校网络的核心区域,包括服务器,IPS设备,业务系统等,是一系列硬件软件设备的总和。一般高中小学校不会牵涉数据中心机房,而大学的数据中心机房则不同,需要专人管理。数据中心机房的日常维护绝不是简单的设备维修,而是一项长期且细致的工作,牵

3、涉的内容很多,包括机房设备维修,系统升级,安防检查等。因而我们需要引入一整套科学合理的管理方式方法来应对风险。 数据中心机房的风险管理牵涉内容很多有:风险辨别,风险分析,风险应对等。华而不实,风险辨别就是辨别出潜在的风险,例如:机房火灾,漏水,停电等,是风险管理中最重要的内容之一,是确定潜在风险并分析找出应对方式方法的前提。所以一般对于风险辨别的内容,我们会花费大量的时间来收集汇总,辨别中会用到的德尔菲法,头脑风暴等方式方法。在数据中心日常运维中,针对辨别出的高风险因素,我们需要制定相关的策略,包括消极和积极2方面的风险应对策略。风险存在是必然,我们需要积极引入风险管理机制,才能在出现问题时候

4、迅速解决。 2 、数据中心机房运维的风险辨别 每个项目特性是千差万别,项目独特性决定项目施行经过存在很多不确定性,尽可能辨别出不确定因素,是确保项目成功的重要因素1。风险辨别不仅仅是风险管理的核心部分,更是基础内容。风险辨别就是运用各种科学方式方法,辨别项目的潜在风险,辨别引发潜在风险的原因以及可能引发的后果。特点:风险辨别覆盖整个项目的生命周期。项目管理经过中,需要对风险进行反复地辨别。风险辨别的方式方法很多,包括德尔菲法,头脑风暴,专家判定等。 为了尽可能全面地辨别出潜在的风险,结合实际情况,对数据中心机房风险辨别步骤包括3步,第一步,进行工作分解构造WBS,目的就是为了更直观地进行风险辨

5、别。第二步,风险收集,针对运维项目,需要组织人员进行现场勘查,发现存在的问题,收集数据中心的资料。针对运维现在状况,组织全体人员进行头脑风暴法辨别潜在的风险,再利用专家调查法对收集的潜在风险进行辨别。第三步,风险确认,组织相关人员进行总结分析归纳,最终得到运维项目风险登记册。 (1工作分解构造WBS 数据中心运维项目根据一定原则进行工作分解,其目的是为了给风险辨别提供根据。首先,组织运维项目的各部门的负责人员,技术人员等进行现场勘查,摸清机房现在状况。根据整体机房运维的思路做好地勘工作,地勘需要记录各个领域的工作,并进行工作分解。 (2风险收集 本次运维项目的风险收集采用头脑风暴会议。在会议之

6、前,需要收集项目相关资料,包括项目技术文件,运维记录,机房资料,合同等。然后提早将地勘记录和收集到的项目资料发给介入会议的人员,确保参会人员能提早充分了解项目内容。会议针对运维项目期间可能存在的风险,进行充分的讨论和汇总。由项目经理担任本次会议支持人,在主持人的推动下,与参会人员就项目的风险群策群力。所有介入人员均有平等发言权,对潜在的风险提出自个的观点。最后将会议的内容进行整理汇总,初步得到机房运维的风险因素。 (3风险确认 风险确认即将收集汇总的风险因素发给专家小组,由专家小组再次确认,记录整理并完成风险辨别。专家小组包括各行业专家、部门负责人等。专家小组通过了解数据中心机房运维项目的基本

7、情况,背景等,对头脑风暴会议收集的风险因素进行屡次征询,直至达成一致意见,完成项目风险辨别。 最终将运维项目风险分为5类,包括设备风险,业务风险,运维管理风险,自然风险,其他风险。设备风险包含:服务器风险,IPS设备风险,环控设备风险等。业务风险包括:特大网络故障风险,一般业务故障风险,业务质量下降风险等。运维管理风险包括:团队管理风险,沟通沟通风险,人员管理风险等。自然风险包括:火灾,水灾,电磁干扰等,其他风险包括:合同风险,需求变化风险,人员技术风险等。 3 、数据中心机房运维的风险分析 风险分析从2方面进行,第一个是定性风险分析,定性分析是指采取一定手段,综合评估分析存在的风险概率以及它

8、的影响程度,并对风险按风险程度排序。同时为下一步分析提供根据。本次运维项目研究所用到的分析工具有概率-影响矩阵,风险分类,专家判定法等。定性风险分析经过作用是为了降低项目的不确定性,并重点关注高优先级的风险,有利于后续针对性开展风险应对。 概率-影响矩阵P-I矩阵是经常使用的工具,它是针对不同程度的风险,进行分级和排序,便于下一步进行定量分析及应对。在概率-影响矩阵中,一般将横坐标和纵坐标从低到高划分为5个标准,用数值0.1、0.3、0.5、0.7、0.9表示,一共划分为25个方格,方格内数字表示风险值R,公式为R=P*I。R数值越低,概率越小,影响程度越小。R数值越高,概率越高,影响程度越大

9、。概率高,影响程度高的区域,一般在右上角,属于高风险,需要采取重点措施,并采取积极地应对策略。概率低,影响程度低的区域,一般在左下角,属于低风险区域,一般列入待观察风险清单,一般不需要采取积极管理措施,监测即可。 第二个是定量风险分析,它是对定性分析经过中,对项目影响很大,风险等级很高的风险进行愈加详细的分析。它是对风险事件的影响程度分析,一般高风险事件分配高数值,低风险分配低数值。定量风险分析的目的是为了确定重大的风险,同时提醒管理人员对高风险,进行密切关注,做好应对准备。 4、 数据中心机房运维的风险应对 风险应对经过是在风险分析之后,针对存在的风险,在分析风险概率及其影响程度基础上,制定

10、一系列措施降低风险、提高有利时机。通过科学合理的管理理论和措施,能够有效躲避和降低项目风险。风险应对措施必须及时有效,并制定多种应对方式,择优选择。 风险应对方式方法有很多,针对已总结的风险,结合数据中心项目的详细情况制定相关的应对策略包括:风险躲避,风险转移,风险预防,风险减轻。 (1风险躲避:风险躲避是为了到达项目目的,改变原来计划,进而躲避风险,减少风险带来的影响。如:调试项目范围,利用多种手段到达目的等。在机房检修的时候,必须秉承着不影响机房正常运行的原则。检修UPS蓄电池,进行放电时,不能影响机房正常运行。检修空调时,应该要一个一个进行检查,不能同时关闭所有机房空调,否则会影响机房正

11、常散热,导致服务器出现故障。维护业务服务器时,必须不能影响其他业务的运行。 (2风险转移:风险转移目的是将风险转嫁给第三方人员,包括风险的影响和责任。在数据中心机房运维中,常见的风险转移就是第三方公司维保。由于数据中心机房的重要性,所以必须保证机房7*24小时都要稳定运行。单单依靠网络中心一个部门是无法保障机房的一年365天的安全,还必需要有其他部门和第三方运维公司的配合。如今高校的数据中心机房都会有第三方公司运维,包括服务器的维保,环境监控的维保,网络安全维保等。转移工具包括合同、履约保证协议、保密协议,保证书等。通过签署合同或协议,能将风险的责任转移给第三方。 (3风险预防:风险预防就是针

12、对存在的风险,制定应急预案,避免风险的发生。施工或运维经过中一旦出现风险或者发现目的与预期有较大偏差时,即可根据应急方案采取相应措施。机房定期进行应急演练是必要的,针对运维情况制定不同的应急演练内容,如:特大网络故障,一般业务故障,火灾等。有利于提高运维人员对突发安全事件的响应与处置能力,保障学校机房安全、持续和稳定运行。机房内不需要的设备必须及时清理,必须建立定期检查制度,对相关设备进行具体检查2。 (4风险减轻:风险减轻就是减微风险事件所带来的影响,减低风险发生的概率。它分为两个方面,第一个是已经发生的风险,要采取积极的措施减少风险带来的影响。第二个是还没发生的风险,要采取积极措施减少发生

13、概率。例如:在机房整理线缆时候,必须根据行业规范,进行走线,并根据统一标准添加标签,确保线材整洁。这样能减少后期维护的成本,当出现线路问题时,能在第一时间找到问题线路。除此之外,在机房配备UPS电源,也是为了保卫服务器设备,在断电情况下能继续工作一段时间,减少服务器忽然断电引发的一系列问题。 5、 结束语 数据中心机房承当着高校全部的信息化业务,运维内容包括服务器,IPS设备,业务系统等软硬件设备,牵涉多个部门和第三方运维公司。因而,高校数据中心机房运维是一个长期、复杂的项目,需要持续性地管理。 风险管理作为一种科学的管理手段,在数据中心机房的运维中的应用有着重要的意义,通过风险管理研究,辨别、分析和应对等,我们能够清楚明晰地了解整个运维项目存在的风险。辨别潜在风险,通过科学的风险分析手段,应对不同程度的风险。 以下为参考文献 1郑渝莎.浅谈通信机房搬迁项目的风险管理J.江西建材,2021(13):261+263. 2王欣.信息机房运维及其管理的主要策略分析J.计算机产品与流通,2020(01):131.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 毕业论文 > 农业相关

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁