《电网公司信息机房运行管理规定(共11页).doc》由会员分享,可在线阅读,更多相关《电网公司信息机房运行管理规定(共11页).doc(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上Q/CSG 中国南方电网有限责任公司企业标准中国南方电网有限责任公司 发 布2009-11-1 实施2009-11-1 发布信息机房运行管理规定Q/CSG 218022009专心-专注-专业目 次 前 言 南方电网公司总部及各下属单位的信息机房是公司重要的信息化基础设施,为了保障信息机房内各种设备、信息系统的安全、可靠运行,特制定本规范。本标准由中国南方电网有限责任公司信息中心提出。本标准由中国南方电网有限责任公司归口管理。本标准由中国南方电网有限责任公司信息中心负责解释。本标准主要起草单位:中国南方电网有限责任公司信息中心。本标准协助起草单位:广东省电力设计研究院。
2、本标准主要起草人:王志英、张建民、沈卫强、解文艳、王英洁。信息机房运行管理规定1 范围本规定明确了信息机房运行管理职责,并对值班和巡检管理、工作票与作业管理、设备管理、不间断电源系统管理、事件与缺陷管理、安全管理、机房环境管理、资料和备品备件管理、存储介质管理、运行报告管理、检查与考核等方面提出了相关要求。本规范适用于南方电网公司总部和各下属单位信息机房的运行管理工作。2 规范性引用文件GB/Z 20986-2007 信息安全事件分类分级指南中国南方电网有限责任公司管理信息系统网络与信息安全突发事件及预警分类分级规定中国南方电网有限责任公司网络与信息安全专项应急预案中国南方电网有限责任公司信息
3、安全事件管理规定3 术语和定义3.1 事件(故障)事件(故障)是指信息系统在没有预先安排的情况下出现的对用户提供服务的中断。3.2 事件(故障)等级 根据中国南方电网有限责任公司管理信息系统网络与信息安全突发事件及预警分类分级规定,事件(故障)分成四级:特别重大突发事件(级)、重大突发事件(级)、较大突发事件(级)、一般突发事件(级)。4 职责按照“谁主管、谁负责,谁运营、谁负责”的要求,公司信息机房运行管理实行“统一领导、分级负责”,在公司信息中心统一领导下,各单位信息部门负责本单位信息机房运行管理工作,并建立健全本单位信息机房运行工作责任制,将责任落实到人。4.1 南网信息中心4.1.1
4、公司信息中心是南方电网公司信息机房运行管理部门。4.1.2 公司信息中心负责以下工作:a) 制定公司信息机房运行管理规定,并督促落实。b) 负责公司总部信息机房日常运行、故障处理工作,处置公司总部信息机房的事件,组织专家对信息机房的重大运维故障、缺陷进行分析,并进行相应整改。c) 负责处置公司信息机房、级网络与信息安全事件,故障排除后组织相关部门召开专题故障分析会。d) 对分、子公司信息机房的运行管理工作进行检查、监督和考核。4.2 分、子公司信息部门4.2.1 各分、子公司信息部门是本单位信息机房运行管理部门。4.2.2 各分、子公司信息部门负责以下工作:a) 贯彻执行公司信息机房运行管理规
5、定,制定本单位信息机房运行管理实施细则,建立健全本单位信息机房运行工作责任制。b) 负责分、子公司本部信息机房日常运行、故障处理工作,处置本单位信息机房的、级网络与信息安全事件,组织专家对信息机房的重大运维故障、缺陷进行分析,并进行相应整改。c) 对本单位、级网络与信息安全事件应上报南方电网信息中心并配合对事件进行处理,故障排除后配合进行分析及故障分析报告的编写。d) 向南方电网信息中心汇报本单位信息机房运行情况,配合检查、监督、考核工作。e) 对下属单位信息机房的运行管理工作进行检查、监督和考核。4.3 分、子公司下属单位信息部门4.3.1 分、子公司下属单位信息部门是本单位信息机房运行管理
6、部门。4.3.2 分、子公司下属单位信息部门负责以下工作:a) 贯彻执行公司信息机房运行管理规定,制定本单位信息机房运行管理实施细则,建立健全本单位信息机房运行工作责任制。b) 负责本单位信息机房日常运行、故障处理工作,处置本单位信息机房的级网络与信息安全事件,组织专家对信息机房的重大运维故障、缺陷进行分析,并进行相应整改。c) 对本单位、级网络与信息安全事件应上报分、子公司信息部门,并配合对事件进行处理,故障排除后配合进行故障分析,编写故障分析报告。d) 向分、子公司信息部门汇报本单位信息机房运行情况,配合检查、监督、考核工作。5 值班和巡检5.1 值班管理5.1.1 在法定工作日的工作时间
7、内,应安排值班人员在监控中心进行现场值班;其余时间应安排非现场值班,并确保在出现问题时值班人员能在1小时内赶至现场。5.1.2 值班人员应佩带胸卡,不得擅离岗位,忠于职守,并按规定填写值班日志。5.1.3 信息机房应设置专用值班电话,并向用户通告电话号码,且应报上级单位备案。5.1.4 值班电话应保证工作时间内有人接听,并做好相关记录。不得人为切断和私人占用值班电话。如果不能马上解决用户问题,应及时安排相关专业工程师协助解决。5.1.5 值班人员每日对机房监控系统进行例行检查,记录信息机房运行环境的物理参数,确保监控系统的正常运行,保证物理环境的安全稳定。5.1.6 交班时要对设备巡检、故障处
8、理及各种变动情况进行交代,做到手续清楚,责任明确,前后衔接,防止错交、漏交。因错交、漏交发生的问题由交班人负责,对交班内容检查不清楚发生的问题由接班人负责。5.1.7 交接班时,如设备或系统发生事故或正在进行调试,暂缓进行交接工作,接班人员应密切配合协同处理,待故障恢复或工作告一段落后再进行交接工作。5.2 日常巡检5.2.1 每日巡检(法定工作日)包含但不限于如下内容:a) 服务器:包括指示灯、系统日志、报警等。b) 网络设备:包括网络接口状态、网络流量、系统日志、各类报警等。c) 安全设备:包括网络接口状态、系统日志、各类报警等。d) 应用系统:包括应用系统运行是否正常,系统服务性能是否满
9、足要求。e) 备份系统:包括数据备份运行是否正常、是否有可用备份磁带等。f) 机房环境:包括机房市电输入配电情况、不间断电源系统电压、不间断电源系统电流、不间断电源系统负载率、温度、湿度、卫生、照明、门禁以及其他报警情况。5.2.2 每月定检包含但不限于如下内容:a) 服务器:包括CPU、内存、磁盘空间使用率、安全授权等。b) 网络设备:包括网络流量分析、网络时延与抖动等。c) 安全设备:包括安全授权、磁盘空间使用率等。d) 防雷设备:包括设备运行状态等。e) 机房环境:包括消防设施运行状态、应急照明状况、空调运行状态等。5.2.3 每半年定检包含但不限于如下内容:a) 不间断电源系统放电检查
10、。b) 检查电源电压、信号线连接是否可靠。5.2.4 每年定检包含但不限于如下内容:a) 测量信息机房内接地电阻有无变化。b) 检查风扇运行情况,包括风力大小,防尘注油。c) 空调室外机检查。d) 用系统诊断程序对设备进行功能检查。6 工作票与作业管理6.1 工作票管理6.1.1 对涉及以下内容的操作行为,必须填写工作票,说明需要操作的设备名称、工作目的、工作时间、影响范围,同时提出操作步骤、采取的安全措施等。a) 故障排除b) 缺陷消除c) 新系统安装、调试d) 系统升级及配置变更e) 系统投运与停运f) 其他可能对系统运行造成影响的操作6.1.2 工作票由相应工作负责人提出申请,并由符合规
11、定的工作票签发人签发后生效。工作票签发人不得兼顾该项工作的工作负责人。6.1.3 工作票审核应从整体上考虑操作必要性、可行性、安全性,检查安全措施是否适当,防止操作影响系统安全运行。6.1.4 如操作将会或可能会对用户造成影响,应提前通知用户。6.1.5 进行系统重大变更操作,如结构调整,核心设备变更或大面积用户停止服务,应报信息部门负责人审批,并提前两天发出系统停运通告。6.1.6 外单位人员施工应由信息部门批准并安排监护人员,经运维人员进行信息机房工作安全技术交底,方可施工。6.1.7 应指定人员对工作票进行定期检查,并向信息部门汇报工作票执行情况。6.1.8 工作票应归档长期保存,以备查
12、验,并定期进行统计。6.2 作业管理6.2.1 操作实施过程应严格按照工作步骤执行,应有监护人对操作进行监护、监督,并逐条落实工作票的安全措施。6.2.2 操作过程中应开启日志记录,并进行归档。6.2.3 要控制在机房工作的人数,在机房内禁止做与工作无关的事情。6.2.4 施工人员用电必须申请,经批准后,按照规定使用电源,不得乱拉电源线、插座。6.2.5 严禁日常作业使用信息机房内不间断电源系统电源供电。6.2.6 设备使用完毕后应注销或锁定系统,以避免不当使用。6.2.7 工作完成后,应立即进行测试检查,确认是否达到作业目的,合格后清理工作现场。7 设备管理7.1 设备标签7.1.1 信息机
13、房内设备均应贴上标签,注明设备名称、设备编码、责任人、投运时间等,对多用途设备应额外标注用途。7.1.2 标签应选用不易损坏的材料,必须打印不允许手写。 7.2 设备台帐7.2.1 在信息机房内所有设备,都必须登记入册,包括设备的型号、采购日期、配置等。7.2.2 设备登记列帐应专人负责,定期盘查,做到设备台帐与实物相符,条理清楚。7.3 设备调入和运出7.3.1 设备进入信息机房前,必须由设备管理员向运维负责人提出申请,经审批同意后,由运维负责人安排设备位置及安装时间,并在规定的时间内,将设备放置指定位置。7.3.2 设备如需运出,由设备管理员向运维负责人申请,经运维负责人同意后,方可运出。
14、7.4 设备日常维护7.4.1 建立设备专管责任制,精心维护、精心操作,确保设备安全可靠运行。7.4.2 认真监控设备运行情况,发现异常应及时向设备管理员和信息部门负责人报告,并做好现场状态信息的记录。7.4.3 接到设备停运通知应填写工作票,根据设备停运安排和注意事项,进行数据备份、设备停运及挂上设备停运标志,并登记设备停运时间。7.4.4 停运设备重新投运需经信息部门负责人批准方可执行,并登记复运时间。7.4.5 设备发生故障,启动相应的故障处理应急预案,在得到信息部门负责人通知后方可进行故障处理工作。7.4.6 设备硬件进行维修作业,维修操作必须严格按照维修手册或说明中的操作规程进行,严
15、禁带电作业,不得在通电情况下进行设备的更换、拆卸、焊接(热插拔设备除外)。7.4.7 更换部件或设备工作变更时,全程工作必须至少有两人以上参加,工作完成后及时做好维修记录。7.4.8 对不能处理的故障或无把握处理的故障,报相关领导后再处理。8 不间断电源系统管理8.1 做好不间断电源系统测试预案,定期做好不间断电源系统的测试和电源的切换。8.2 严格按照后备电池的运行方式和寿命,做好后备电池的定期充放电和更换。8.3 不间断电源系统市电供应出现故障时,若在后备电池容量范围内仍不能恢复市电,系统运行人员须通知有关人员对运行系统的数据进行保存,尽量降低辅助系统、显示器等非核心设备的耗电以最大限度地
16、保证核心系统的运行。8.4 不间断电源系统本身发生故障时,应采用市电直接供电以保证系统的正常运行。8.5 利用不间断电源系统的监控管理功能和故障报警功能,保证在不间断电源系统故障情况下,发出告警并及时对设备进行相关操作。9 事件与缺陷管理9.1 事件(故障)管理9.1.1 发生故障后,值班人员应立即报告信息部门负责人,同时信息部门组织人员对故障进行处理,并记录处理过程,故障处理过程要在保障安全性的基础上,恢复系统的可用性,必要时,应启动应急预案(见中国南方电网有限责任公司网络与信息安全专项应急预案)。9.1.2 信息部门应对故障影响的范围和严重程度做出判断,所有故障须通报相关主管领导;对不能立
17、即排除的故障,应通知相关用户并向相关领导进行汇报。9.1.3 信息部门应制定系统关键点故障处理的应急预案,并通过演练完善应急预案。9.2 缺陷管理9.2.1 运维人员发现缺陷后应及时报告运维负责人,对缺陷进行定性并记入缺陷记录。9.2.2 危急缺陷或严重缺陷由运维人员15分钟内报告信息部门负责人,并通知设备管理员和系统管理员。运维人员应立即分析缺陷原因,提出解决办法。30分钟内无法解决的缺陷,应及时联系相关设备厂商协助解决。9.2.3 一般缺陷由运维人员及时处理,或添加至缺陷处理计划中,并填写运行日志。9.2.4 在缺陷没有得到处理以前,应加强监视或采取必要措施,防止进一步恶化。已经记录的缺陷
18、,如在监视过程中有进一步恶化的趋势,应及时上报。9.2.5 缺陷消缺后,由运维负责人对缺陷进行消缺检查。9.2.6 缺陷消除后,运维人员需填写缺陷处理报告并及时注销记录。9.2.7 定期对未消除的缺陷进行清理,并对处理完的缺陷汇总、归档。10 安全管理10.1 人员进出管理10.1.1 来访人员须经信息部门批准后方可进入,期间须由相关人员全程陪同并及时做好登记工作,同时记录来访者进入和离开机房时间。10.1.2 进入信息机房前必须换工作鞋或戴专用鞋套。10.1.3 所有来访者要予以监督,只允许来访者访问特定的、已授权的设备,并介绍区域安全要求和应急程序说明。10.1.4 第三方支持服务人员只有
19、在需要时才能访问受限安全区域或敏感信息处理设施。所有操作必须进行记录。10.1.5 携带计算机、磁盘、摄像机、照相机等进出机房,必须经信息部门同意,并由机房管理人员进行核查登记。10.1.6 严禁携带强磁物品、放射性物品、武器、易燃物、易爆物或具有腐蚀性等危险品进入信息机房,与工作无关的物品(包括个人手提包等)不得带入信息机房。10.1.7 机房门禁卡须统一管理和发放,使用人员必须妥善保管,不得擅自借给他人使用。10.1.8 值班人员离开机房时,必须随手关门。10.2 设备安全管理10.2.1 重要设备应坚持双人开机、双人关机原则,开机前认真检查电源、空调设备工作是否正常运行。10.2.2 硬
20、件设备的技术支持原则上不使用远程技术支持,确需进行远程技术支持的报经信息部门同意后,方可进行。10.2.3 设备维修特别是需离场维修或承包给公司外部人员维护、维修时,应核实该设备中是否存储有涉及公司秘密、不宜公开的内部资料和帐号、密码等,如有应采取拆卸硬盘、有效删除有关资料等有效措施,防止泄密。10.2.4 设备的硬件维护操作时必须戴防静电手套。10.2.5 对怀疑有故障的设备不允许在机房内测试,避免出现电路短路现象。10.2.6 加强设备和用电安全管理,未经批准不得随意搬移、拆毁和插接各种用电设备。11 机房环境管理11.1 机房安全出入口应有明显标志和企业VI标识。11.2 机房须保持干净
21、整洁、布线整齐、排列有序。11.3 应定期对机房地板进行吸尘打扫,保证地板干净、干燥。11.4 任何人不得将食物及无关用品带入机房,禁止在机房内吸烟、喝水、进食或从事其他工作以外的活动,不准随地抛扔纸屑、废物,不得大声喧闹。11.5 不得在机房内随意放置材料、工具、仪器及无关物品等。11.6 作业工作完毕后,必须将工具、资料、材料等放回原处,并将现场清扫干净。12 资料和备品备件管理12.1 资料管理12.1.1 应做好资料的收集、整理、登记、造册、保管、鉴定、利用等工作,设备技术资料应齐全、正确、统一、清晰。12.1.2 资料应由专人负责管理,并负责资料安全、严防机密资料外泄。12.1.3
22、根据资料的重要程度与保密要求,将重要资料复印并备份电子资料。12.1.4 信息机房内的安全监控资料应妥善保管,保存期至少为三个月;查阅、更新、销毁该资料须经信息部门批准。12.1.5 在进行项目建设时,由项目经理或指定专人负责收集和整理整个工程过程中产生的文档,进行分类,标注必要的说明,在工程验收后一周内将全部项目文档资料提交文档管理人员归档。12.1.6 信息机房内的各种图纸、资料、文件、工具、仪表在使用后应归还原处,未经允许不得擅自带离信息机房。12.1.7 信息机房内的设备配置、网络拓扑等资料,未经批准不得任意抄录、复制。12.1.8 设备调动时,原随机的技术资料应随机转移,使用过程中建
23、立的资料,可择其重要性予以复制,一并列出清单,随机转移。12.1.9 设备维护报告、定期测试记录、故障分析报告和其他原始记录等,均应集中存放,专人保管,经信息部门同意可进行销毁或删除。12.2 备品备件管理12.2.1 应建立备品备件档案,记录备品备件种类、数量以及送修使用等情况。12.2.2 应建立备品备件出入库制度,备品备件入库时应进行验收,按类登记入帐和存放,备品备件领用应办理登记手续。12.2.3 对备品备件应定期盘查,做到帐物相符,条理清楚。13 存储介质管理13.1 所有存储介质未经同意一律不准外借,不准流出公司。13.2 备份介质需定期(每半年)进行检查,一旦发现介质损坏,应立即
24、更换。13.3 磁盘、磁带等介质使用有效期为三年,三年后须更换新介质进行备份。14 运行报告管理14.1 应定期对设备及应用系统运行情况进行统计分析,对设备及应用系统的缺陷及故障进行登记,并做好运行维修记录,每月、每年提供运行报告报送信息部门。14.2 运行月报应包含设备及应用系统运行情况、存在的主要问题和处理措施、下月主要工作计划等内容。14.3 对统计数据应进行认真分析,积极查找问题原因,提出合理分析和建议。14.4 定期召开运行质量分析会,针对运行过程中发现的薄弱环节提出改进措施,并落实责任人。质量分析会议要有记录,下次会议要检查措施执行情况及质量改善情况。15 检查与考核15.1 信息部门应定期检查机房日常运维工作,核查运行日志,以及相关工作表单。15.2 信息部门每年末对信息机房运维根据本规定进行考核。16 附则16.1 各单位应结合本地实际情况制定相关实施细则。16.2 本规范由中国南方电网有限责任公司信息中心负责解释。16.3 本规范自颁布之日起执行。