《lxy机房运维管理.ppt》由会员分享,可在线阅读,更多相关《lxy机房运维管理.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、拼搏拼搏运行维护管理的意义运行维护管理的意义v提高可靠性:降低故障率v提高可用性:减少宕机时间 v提高安全性:减少灾害v提高经济性:增长设备寿命拼搏拼搏运行维护管理的本质运行维护管理的本质v人员技能的提高 技术培训 经验交流拼搏拼搏运行维护管理的本质运行维护管理的本质v制度流程的建立、执行 机房运维制度的建立 机房运维制度的执行 管理机制拼搏拼搏机房运行管理制度机房运行管理制度一. 值班制度二. 巡视制度三. 日常管理制度四. 运行维护制度五. 安全保密制度拼搏拼搏一一. 值班制度值班制度v机房昼夜要有人值班v值班人员要遵守值班守则v值班守则拼搏拼搏二二. 巡视制度巡视制度v机房环境的巡视v机
2、房设备的巡视拼搏拼搏1. 机房环境的巡视机房环境的巡视v 机房门窗的关闭情况v 机房的卫生状况v 机房的灯光状况v 机房的空气清新度状况拼搏拼搏2. 机房设备的巡视机房设备的巡视v 对网络运行保障设施要经常巡视v 巡视供电系统、UPS、电池v 巡视空调的工作状况v 巡视新风机和空气净化器的工作状况v 巡视消防报警系统拼搏拼搏三三. 日常管理制度日常管理制度v 经常注意保持机房的环境卫生v 不得将食品、饮品带入机房v 机房内禁止吸烟v 不得在机房内乱扔物品拼搏拼搏四四. 运行维护制度运行维护制度v 配电柜一年进行至少2次维护检查v UPS一年进行2次巡检v 机房专用空调每月进行一次巡检v 新风机
3、每年2次维护v 空气净化器每季度维护一次v 机房消防系统每年一次检测v 机房防雷设施每年一次检测v 机房每年进行2次保洁拼搏拼搏五五. 安全保密制度安全保密制度v 1. 门禁管理v 2. 防雷击、防火、防水、防盗、防虫害v 3. 网络运行安全管理v 4. 系统设备安全管理v 5. 认真遵守国家的各项保密制度拼搏拼搏1. 门禁制度门禁制度v 机房要设有门禁v 机房门禁7X24小时保持运行v 机房门禁的2个作用v 机房工作人员需持卡进入机房v 非机房工作人员进入机房需登记拼搏拼搏2.防雷击、防火、防水、防盗、防虫害防雷击、防火、防水、防盗、防虫害v防雷击v防火、防水v防盗v防虫害拼搏拼搏3. 网络
4、运行安全管理网络运行安全管理v防入侵v防病毒v涉密网拼搏拼搏4. 系统、设备安全管理系统、设备安全管理v 进入机房不得带拷贝工具和便携机v 机房内所有服务器应设有开机密码、系统登录密码v 机房内所有服务器都应设有带密码的屏幕保护v 非网管人员不得私自操作任何服务器拼搏拼搏5. 认真执行国家的保密制度认真执行国家的保密制度v 涉及政务、金融、高科技、网上交易v 定期集中销毁废弃的涉密纸、物v 非机房工作人员在机房工作时必须有机房值班人员陪同v 机房内各类服务器应由专人分类管理v 建立设备、资料责任制拼搏拼搏应用举例应用举例 附件 机房运行管理制度拼搏拼搏机房内的危机管理机房内的危机管理v史蒂文芬
5、克(Steven Fink)的危机管理(Crisis Management-Planning for the inevitable): 组织对所有危机发生因素的预测、分析、化解、防范等等而采取的行动。v罗伯特希斯(Robert L. Heath)的危机管理(Crisis Management for Managers and Executives): 管理者考虑如何减少危机情境的发生、如何做好危机管理的准备、如何规划以及如何培训员工应对危机局面、如何从危机中很快复原。拼搏拼搏危机管理的危机管理的PPRR模式模式v Prevention(预防)观念、流程v Preparation(准备)人力物力
6、资源v Response(响应)应急预案,消除危机的短期影响v Recovery(恢复)经验总结,消除危机带来的中长期影响拼搏拼搏应急预案应急预案v事前“马后炮” “一旦发生XX事故,管理员应该在XX分钟之内采取以下措施:一、XX;二、XX;。”拼搏拼搏v 第一步:列出危机或称风险 例如,IT系统宕机、火灾、空调漏水、机房温度超高等。v 第二步:排除不存在的风险v 第三步:将各种风险列举在应急预案的风险目录v 第四步:横向分类与纵向分级 横向分类:将目录中类似的风险进行分类,比如可将机房的风险划分为的灾难风险(如火灾)、生产中断风险(如宕机)、安全隐患风险(室温过高、接地不良)、财产风险和人力
7、资源风险等等。 纵向分级:按各类风险的大小和威胁程度排序,从而建立起风险管理的优先顺序。比如可将IT系统宕机定为I级风险,而将室温升高定为II级风险,将湿度过低定为III级风险。拼搏拼搏v 第五步:设计针对这些风险的预先和应急处理措施 1.对可以预见且时间和资源允许处理的风险,采取排出和缩减。 2.对可以预见但可能发生概率较低的风险,可以进行风险转移。如,将火灾风险转移给保险公司,将UPS停机风险转移给UPS厂商或UPS服务商。 3.对现在没有表现出来,但其爆发总存在一定征兆的风险,采取建立预警系统对其监控。 4.对那些发生时间完全不可预测的风险,则必须建立起一个协调人力资源的“危机处理机构组
8、织结构图”以及一个指导人员操作的“危机应对表”,使运维管理人员和相关部门、人员能够在危机发生时有组织地、按部就班地执行。拼搏拼搏v “危机处理机构组织结构图”的建立预先协调跨部门的资源v “危机应对表”管理人员根据对各种可能出现的危机设想,设计出的应对措施。拼搏拼搏v 环境监控机房电力质量监测机房温度监测机房湿度监测新风风量监测v IT微环境监测机架电力质量监测机架温度监测机架湿度监测运行维护管理的技术手段运行维护管理的技术手段监控对象监控对象拼搏拼搏v故障预测:防止故障的发生v故障报警:缩短故障恢复时间运行维护管理的技术手段运行维护管理的技术手段监控目的监控目的拼搏拼搏 故障预防27-2-101234发现隐患采取措施设备将发生故障设备发生故障的 时间被推迟结束结束