数据中心的建设与管.ppt

上传人:wuy****n92 文档编号:69530692 上传时间:2023-01-06 格式:PPT 页数:68 大小:3.02MB
返回 下载 相关 举报
数据中心的建设与管.ppt_第1页
第1页 / 共68页
数据中心的建设与管.ppt_第2页
第2页 / 共68页
点击查看更多>>
资源描述

《数据中心的建设与管.ppt》由会员分享,可在线阅读,更多相关《数据中心的建设与管.ppt(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、探讨一:探讨一:数据中心建设与管理中存在的问题数据中心建设与管理中存在的问题CPU热量热量 100W高密度的服务器安装高密度的服务器安装更高的存储容量更高的存储容量需要更多的电能需要更多的电能需要灵活的配电需要灵活的配电和供电方案和供电方案更大的热负荷更大的热负荷(需需要更大制冷量要更大制冷量)TCO拥有总成本拥有总成本(总总体更经济的方案)体更经济的方案)7x24业务运行需求业务运行需求业务咨询业务咨询数据中心用户数据中心用户/管理者管理者 数据中心机房的设计,缺乏灵活性:数据中心机房的设计,缺乏灵活性:一旦配电系统开始运行后,就没有一旦配电系统开始运行后,就没有任何变动的可能。这意味着如果

2、要扩容,任何变动的可能。这意味着如果要扩容,需要付出巨大的努力。同时,在维护维需要付出巨大的努力。同时,在维护维修时影响系统可用性;还投入了非常高修时影响系统可用性;还投入了非常高的初期投资!的初期投资!问题问题1:1:供电系统的供电系统的灵活性问题灵活性问题问题问题2:2:布线布线随意,缺乏规随意,缺乏规范有序管理。范有序管理。强弱电线缆管理问题:强弱电线缆管理问题:1 1、通常缺少规划,强弱电线缆交差。、通常缺少规划,强弱电线缆交差。2 2、走线随意,乱拉乱接。、走线随意,乱拉乱接。3 3、忽视安全问题。、忽视安全问题。4 4、标签信息不明确、不准确。、标签信息不明确、不准确。问题问题3:

3、3:数据中心数据中心的散热!的散热!目前设备散热问题已经日益成为数据目前设备散热问题已经日益成为数据中心设计的最主要限制因素。中心设计的最主要限制因素。气流难以像电流一样被约束。冷热空气流难以像电流一样被约束。冷热空气的混合、对流、短路等,均会造成气流气的混合、对流、短路等,均会造成气流组织偏离设计值,从而使部分机柜得不到组织偏离设计值,从而使部分机柜得不到足够的风量,而同时又有一部分冷风没有足够的风量,而同时又有一部分冷风没有被利用。这种情况将降低空调机的工作效被利用。这种情况将降低空调机的工作效率,浪费电能。率,浪费电能。由于未解决的制冷和供电问题意味着,由于未解决的制冷和供电问题意味着,

4、由于未解决的制冷和供电问题意味着,由于未解决的制冷和供电问题意味着,有时候很多机柜只安装一半设备。这种小型有时候很多机柜只安装一半设备。这种小型有时候很多机柜只安装一半设备。这种小型有时候很多机柜只安装一半设备。这种小型化安装的方案,给数据中心带来了更高的固化安装的方案,给数据中心带来了更高的固化安装的方案,给数据中心带来了更高的固化安装的方案,给数据中心带来了更高的固定运行成本(场地,机柜,电能)。定运行成本(场地,机柜,电能)。定运行成本(场地,机柜,电能)。定运行成本(场地,机柜,电能)。这样的数据中心将需要安装更多的服务这样的数据中心将需要安装更多的服务这样的数据中心将需要安装更多的服

5、务这样的数据中心将需要安装更多的服务器机柜,更高的计算性能将带来同比例更高器机柜,更高的计算性能将带来同比例更高器机柜,更高的计算性能将带来同比例更高器机柜,更高的计算性能将带来同比例更高固定成本。固定成本。固定成本。固定成本。问题问题4:4:数据中心空间数据中心空间需求问题需求问题!您会将这您会将这些服务器些服务器装在一个装在一个机柜中吗机柜中吗?12 kW(37台台1U PC服务器)服务器)18 kW(5台台7U 刀刀片服务器片服务器)是否会是以下的方案是否会是以下的方案?3.6 kW/机柜机柜4 kW/机柜机柜80%机柜空间空置机柜空间空置?扩大数据中心扩大数据中心?浪费的空间如何处理浪

6、费的空间如何处理?问题问题5:安全管理问题!安全管理问题!目前各种安全有关的领域,比如目前各种安全有关的领域,比如空调、电源、机柜安全,通常是分开空调、电源、机柜安全,通常是分开考虑的。考虑的。安全管理若集成在一个远程管理安全管理若集成在一个远程管理系统中统一监管,这样将减少拥有总系统中统一监管,这样将减少拥有总成本。电源、空调、机柜安全必须考成本。电源、空调、机柜安全必须考虑在一个主动的安全系统中。虑在一个主动的安全系统中。安装基础设施占安装基础设施占%/机房的容量机房的容量服务年限服务年限 缺乏模块化,集约化的缺乏模块化,集约化的ITIT基础设施投基础设施投资方案带来超规模的投资。结果带来

7、更高资方案带来超规模的投资。结果带来更高的初期投资资,更高的电能和租金的固定的初期投资资,更高的电能和租金的固定成本。成本。模块化结构,集约化提供了根据实际模块化结构,集约化提供了根据实际需求的初期投投资和运行成本!需求的初期投投资和运行成本!超规模的投资超规模的投资安装满足实际需求的安装满足实际需求的ITIT基础设施!基础设施!目前基础设施投资和满足实际需求的基目前基础设施投资和满足实际需求的基础设施投资的比较础设施投资的比较 问题问题6:超规模投资,浪超规模投资,浪费成本!费成本!探讨二:探讨二:新一代数据中心的设计理念新一代数据中心的设计理念一、数据中心整体布局方面一、数据中心整体布局方

8、面1)性能面积比)性能面积比运算量运算量/面积面积服务器台数服务器台数/面积面积随着随着IT设备的小型化,机房面积将越来越小设备的小型化,机房面积将越来越小高密度、虚拟化数据中心高密度、虚拟化数据中心一、数据中心整体布局方面一、数据中心整体布局方面2)性能能耗比)性能能耗比高效率高效率UPS供电供电围护结构的绝热处理围护结构的绝热处理“冷库式冷库式”机房与机房与“冰箱式冰箱式”机房,让机房,让能源充分有效的利用能源充分有效的利用一、数据中心整体布局方面一、数据中心整体布局方面3)“机柜就是机房机柜就是机房”的思路的思路“IT微环境微环境”或或“模块化机柜模块化机柜”设计设计“选址选址-布局布局

9、-设备摆放设备摆放-机柜摆放机柜摆放”的设计的设计逻辑将被完全逆转逻辑将被完全逆转机柜内部的设计将被更加重视机柜内部的设计将被更加重视一、数据中心整体布局方面一、数据中心整体布局方面4)“一体化机房一体化机房”或或“整体机房整体机房”的概念的概念系统化设计、预生产、组件式的机房构建模式系统化设计、预生产、组件式的机房构建模式灵活性、扩展性灵活性、扩展性质量控制:工厂与现场质量控制:工厂与现场二、数据中心供配电方面二、数据中心供配电方面1)由备用供电系统向不停电供电系统发展)由备用供电系统向不停电供电系统发展柴油发电机将起到更重要的作用柴油发电机将起到更重要的作用机房供配电系统将在机房供配电系统

10、将在UPS基础上进一步基础上进一步提升提升UPS供配电系统的标准化、模块化将被供配电系统的标准化、模块化将被普遍采用普遍采用二、数据中心供配电方面二、数据中心供配电方面2)机柜级供配电的管理将受到重视)机柜级供配电的管理将受到重视目前供配电系统中目前供配电系统中“端端-端端”路径中最薄路径中最薄弱的一环弱的一环机柜机柜PDU的监测管理的监测管理机柜能耗管理机柜能耗管理二、数据中心供配电方面二、数据中心供配电方面3)直流供电系统有可能提出并行研究)直流供电系统有可能提出并行研究IT设备抗干扰能力在下降设备抗干扰能力在下降交流供电系统中的谐波问题、地线噪声交流供电系统中的谐波问题、地线噪声直流供电

11、系统可能成为一种被迫的选择直流供电系统可能成为一种被迫的选择三、温湿度控制方面三、温湿度控制方面1)冷媒的变化)冷媒的变化目前从冷源到目前从冷源到IT设备普遍采用的冷媒是空气,设备普遍采用的冷媒是空气,但是空气的能量传输率非常低但是空气的能量传输率非常低机房内大量空间被用作气流组织的通道,而且机房内大量空间被用作气流组织的通道,而且难以控制难以控制势必将采用冷冻水或其他新型冷媒势必将采用冷冻水或其他新型冷媒三、温湿度控制方面三、温湿度控制方面2)冷却系统布局的变化)冷却系统布局的变化由整个机房作为制冷系统的模式向机柜作为制由整个机房作为制冷系统的模式向机柜作为制冷系统的模式变化冷系统的模式变化

12、“冰箱式冰箱式”机房是机柜或者机柜群模式的表现机房是机柜或者机柜群模式的表现甚至会朝甚至会朝“机柜机柜U”级和级和“服务器服务器”级制冷系统级制冷系统的方向发展的方向发展三、温湿度控制方面三、温湿度控制方面3)节能环保型技术将得到开发和应用)节能环保型技术将得到开发和应用在冬季,利用室外空气作为冷源的热交换设备在冬季,利用室外空气作为冷源的热交换设备与楼宇空调系统共用的制冷设备,提高利用率与楼宇空调系统共用的制冷设备,提高利用率热回收系统热回收系统四、机房安全监控管理方面四、机房安全监控管理方面1)IT设备的操控向集中化发展设备的操控向集中化发展KVM基于基于IP、跨平台、远程集中管理模式、跨

13、平台、远程集中管理模式基于身份认证、分组管理基于身份认证、分组管理四、机房安全监控管理方面四、机房安全监控管理方面2)机房基础设备的监控管理将向网络化、标)机房基础设备的监控管理将向网络化、标准化发展准化发展各机房基础设备厂商使用各自通信协议和监各机房基础设备厂商使用各自通信协议和监管平台的局面将被彻底改变,串口将被网口管平台的局面将被彻底改变,串口将被网口取代,所有设备通过网络进行实时监控取代,所有设备通过网络进行实时监控与管理与管理四、机房安全监控管理方面四、机房安全监控管理方面3)机房基础设备的监控管理与设备管理的)机房基础设备的监控管理与设备管理的一体化一体化实现数据中心业务应用、数据

14、存储、服务器、实现数据中心业务应用、数据存储、服务器、网络、基础设施的集中管控网络、基础设施的集中管控机房设备的控制功能将进一步加强,如根据服机房设备的控制功能将进一步加强,如根据服务器的数量务器的数量 或负载情况,自动调节机柜组的制或负载情况,自动调节机柜组的制冷系统风量;视频或照明的移动监测冷系统风量;视频或照明的移动监测四、机房安全监控管理方面四、机房安全监控管理方面4)管理终端的变化)管理终端的变化机房设备的管理的终端,将由本地操作,到机房设备的管理的终端,将由本地操作,到通过通过IP网络电脑终端操作,发展为移动网络电脑终端操作,发展为移动PDA,实现无时无地不在监管机房设备与环,实现

15、无时无地不在监管机房设备与环境。境。探讨三:探讨三:数据中心的日常运维管理数据中心的日常运维管理一、数据中心的作用与特点一、数据中心的作用与特点 1、数据中心的作用、数据中心的作用基础资源整合:基础资源整合:高标准的数据机房、畅通的网络是保证应用稳定高标准的数据机房、畅通的网络是保证应用稳定运行的基础。统一建立一个机房,避免机房建设运行的基础。统一建立一个机房,避免机房建设的重复投资。的重复投资。设备集中管理,统一调配,能够充分发挥各个设设备集中管理,统一调配,能够充分发挥各个设备的作用。备的作用。运行维护人员的人力资源整合运行维护人员的人力资源整合一、数据中心的作用与特点一、数据中心的作用与

16、特点 2、数据中心的作用、数据中心的作用系统稳定运行的保障:系统稳定运行的保障:保证系统能够安全、稳定、高效地运行。保证系统能够安全、稳定、高效地运行。建立一个全面的、动态的安全防范,综合利用各种建立一个全面的、动态的安全防范,综合利用各种安全技术,制定相应的管理制度和管理规范以保证安全技术,制定相应的管理制度和管理规范以保证数据中心的安全,保证关键数据、关键应用的安全数据中心的安全,保证关键数据、关键应用的安全以及关键业务部门的安全,实现业务网络及其应用以及关键业务部门的安全,实现业务网络及其应用系统的安全高效运行系统的安全高效运行搭建合理的服务器运行体系架构,调整应用的布局搭建合理的服务器

17、运行体系架构,调整应用的布局对各应用及应用软件的优化,提高系统运行的效率对各应用及应用软件的优化,提高系统运行的效率一、数据中心的作用与特点一、数据中心的作用与特点 3、数据中心的作用、数据中心的作用数据与信息安全的保障:数据与信息安全的保障:设置合理的数据库模式,便于管理,同时易于各设置合理的数据库模式,便于管理,同时易于各系统之间的数据共享和交换。系统之间的数据共享和交换。要保证数据的安全,使数据不会因意外的灾难而要保证数据的安全,使数据不会因意外的灾难而损毁,要做好数据备份与恢复工作。损毁,要做好数据备份与恢复工作。进行安全审计,能够对用户的行为进行记录,并进行安全审计,能够对用户的行为

18、进行记录,并能够进行事后分析。能够进行事后分析。一、数据中心的作用与特点一、数据中心的作用与特点 4、数据中心的建设与管理的内容、数据中心的建设与管理的内容1)、机房基础实施)、机房基础实施2)、网络线路实施)、网络线路实施3)、服务器体系结构)、服务器体系结构4)、数据存储与备份)、数据存储与备份5)、安全防护与加固)、安全防护与加固6)、队伍建设与制度规范)、队伍建设与制度规范机房基础实施建设机房基础实施建设防尘、防静电的环境防尘、防静电的环境可靠的电力保证可靠的电力保证适宜的温度和湿度适宜的温度和湿度消防系统消防系统门禁与监控门禁与监控布线布线参考的标准:接下页参考的标准:接下页机房基础

19、实施建设(续)机房基础实施建设(续)参考的标准:电子计算机机房设计规范(GB50174-93)计算站场地技术要求(GB2887-89)计算站场地安全技术(GB9361-88)计算机机房用活动地板的技术要求(GB6650-86)电子计算机机房施工及验收规范(SJ/T30003)电气装置安装工程接地装置施工及验收规范(GB50169-92);中国工程建设标准化协会标准建筑与建筑群综合布线系统工程设计规范CECS72:95网络线路实施建设网络线路实施建设冗余的网络设计,保证网络的畅通无阻冗余的网络设计,保证网络的畅通无阻加强网络监控,及时发现问题加强网络监控,及时发现问题关键部门设置专线,保证数据传

20、输的完整性关键部门设置专线,保证数据传输的完整性服务器体系架构建设服务器体系架构建设数据中心的服务器系统必须从整体上规划,根据数据中心的服务器系统必须从整体上规划,根据应用的需求合理布局,切忌一个应用系统一套服应用的需求合理布局,切忌一个应用系统一套服务器系统,这样很不利于资源的优化配置,既不务器系统,这样很不利于资源的优化配置,既不好管理,又不能实现资源的共享。好管理,又不能实现资源的共享。服务器架构尽量采用目前比较流行的体系架构。服务器架构尽量采用目前比较流行的体系架构。服务器系统高可用性,根据应用的需求而定。服务器系统高可用性,根据应用的需求而定。服务器系统的扩展性要考虑应用的发展需求。

21、服务器系统的扩展性要考虑应用的发展需求。开发、测试、正式运行三条线要分开,不要在运开发、测试、正式运行三条线要分开,不要在运行环境开发、测试程序。行环境开发、测试程序。数据存储与备份建设数据存储与备份建设备份系统与要求的恢复时间紧密相关,无论多么备份系统与要求的恢复时间紧密相关,无论多么先进的备份系统,一定要有针对各种情况的恢复先进的备份系统,一定要有针对各种情况的恢复步骤,已备不时之需步骤,已备不时之需设备的备份设备的备份热备份、冷备份热备份、冷备份数据的备份数据的备份文件数据文件数据数据库数据数据库数据容灾系统容灾系统安全防护与加固建设安全防护与加固建设网络安全:防攻击、防窃密、防监听网络

22、安全:防攻击、防窃密、防监听合理架设防火墙、入侵检测等设备合理架设防火墙、入侵检测等设备主机安全:物理安全、防入侵主机安全:物理安全、防入侵要定期清理用户、修改密码、安装补丁程序、停要定期清理用户、修改密码、安装补丁程序、停止不必要的服务等止不必要的服务等应用安全:防伪造、防攻击、防篡改应用安全:防伪造、防攻击、防篡改数据安全:防止数据丢失、破坏数据安全:防止数据丢失、破坏数据备份、容灾应急数据备份、容灾应急终端安全:防病毒、安全知识培训终端安全:防病毒、安全知识培训安全审计:事后追查的有效手段安全审计:事后追查的有效手段入侵监测入侵监测成立紧急问题相应小组成立紧急问题相应小组队伍与制度建设队

23、伍与制度建设无论多么先进的设备和技术,如果没有人进无论多么先进的设备和技术,如果没有人进行管理,都是不能很好的发挥作用的。因此数行管理,都是不能很好的发挥作用的。因此数据中心在建设初期就必须考虑队伍建设问题。据中心在建设初期就必须考虑队伍建设问题。在队伍建设中,要注意建立整个团队的服务在队伍建设中,要注意建立整个团队的服务意识。只有优良的服务,才能使所有的应用更意识。只有优良的服务,才能使所有的应用更好的发挥作用。服务不仅仅是态度,更重要的好的发挥作用。服务不仅仅是态度,更重要的是要有雄厚的技术做后盾。因此应建立一支有是要有雄厚的技术做后盾。因此应建立一支有层次的队伍。层次的队伍。其次,还要有

24、规范的制度来约束和规范日常其次,还要有规范的制度来约束和规范日常的运维管理行为。的运维管理行为。二、数据中心的运维管理概述二、数据中心的运维管理概述1、数据中心运维管理的意义、数据中心运维管理的意义提高可靠性:降低故障率提高可靠性:降低故障率提高可用性:减少宕机时间提高可用性:减少宕机时间提高安全性:减少灾害发生提高安全性:减少灾害发生提高经济性:增长设备寿命提高经济性:增长设备寿命二、数据中心的运维管理概述二、数据中心的运维管理概述2、数据中心运维管理的本质、数据中心运维管理的本质人员技能的提高:技术培训、经验交流人员技能的提高:技术培训、经验交流制度的建立、执行:运维制度建立、运维制度执制

25、度的建立、执行:运维制度建立、运维制度执行、管理机制行、管理机制 机房管理制度机房管理制度 机房出入登记制度机房出入登记制度 机房值班巡视制度机房值班巡视制度 机房系统设备运维制度机房系统设备运维制度 安全保密制度安全保密制度二、数据中心的运维管理概述二、数据中心的运维管理概述 3、数据中心运维管理的手段、数据中心运维管理的手段环境监控环境监控设备监控设备监控网络监控网络监控应用监控应用监控三、数据中心的运维管理三、数据中心的运维管理-危机管理危机管理 1、危机管理的定义、危机管理的定义史蒂文史蒂文.芬克的芬克的危机管理危机管理:组织对所有危机发:组织对所有危机发生因素的预测、分析、化解、防范

26、等而采取的行生因素的预测、分析、化解、防范等而采取的行动动罗伯特罗伯特.希斯的希斯的危机管理危机管理:管理者考虑如何减:管理者考虑如何减少危机情境的发生、如何做好危机管理的准备、少危机情境的发生、如何做好危机管理的准备、如何规划以及如何培训员工应对危机局面、如何如何规划以及如何培训员工应对危机局面、如何从危机中快速恢复从危机中快速恢复三、数据中心的运维管理三、数据中心的运维管理-危机管理危机管理 2、危机管理的、危机管理的PPRR模式模式Prevention(预防预防):观念、意识、流程:观念、意识、流程Preparation(准备准备):人力、物力资源:人力、物力资源Response(响应响

27、应):应急预案,消除危机的短期:应急预案,消除危机的短期影响影响Recovery(恢复恢复):总结经验,消除危机带来的:总结经验,消除危机带来的中长期影响中长期影响三、数据中心的运维管理三、数据中心的运维管理-危机管理危机管理 3、应急预案、应急预案对机房各类设备的功能、指标、结构心中有数对机房各类设备的功能、指标、结构心中有数事前事前“马后炮马后炮”:针对机房供配电、消防、空:针对机房供配电、消防、空调、漏水、网络、安全等分别制定应急预案。调、漏水、网络、安全等分别制定应急预案。“一旦发生一旦发生XX事故,值班管理人员应该在事故,值班管理人员应该在XX分分钟内采取以下措施:一、钟内采取以下措

28、施:一、XX;二、;二、XX”三、数据中心的运维管理三、数据中心的运维管理-危机管理危机管理 3、应急预案、应急预案第一步、列出机房存在的危机或风险第一步、列出机房存在的危机或风险 火灾、空调故障、漏水、供配电、温湿度火灾、空调故障、漏水、供配电、温湿度第二步、分析排除不存在的风险第二步、分析排除不存在的风险第三步、将各种可能风险列举在应急预案中第三步、将各种可能风险列举在应急预案中第四步、横向分类与纵向分级第四步、横向分类与纵向分级 横向分类:灾难风险(火灾)、中断风险(停电、横向分类:灾难风险(火灾)、中断风险(停电、宕机)、安全隐患风险(温度过高、接地不良)。宕机)、安全隐患风险(温度过

29、高、接地不良)。纵向分级:按各类风险(事件)危害程度排序,建纵向分级:按各类风险(事件)危害程度排序,建立风险管理优秀级和报警。立风险管理优秀级和报警。三、数据中心的运维管理三、数据中心的运维管理-危机管理危机管理 3、应急预案、应急预案第五步、针对各类风险事件,制定应急处理措施第五步、针对各类风险事件,制定应急处理措施 准备工具、备品备件准备工具、备品备件 制定事件预警、报告流程制定事件预警、报告流程四、数据中心的运维管理四、数据中心的运维管理-制度管理制度管理实现目标:实现目标:保证机房电力系统、保证机房电力系统、UPS系统、空调新风、消防系统、空调新风、消防系统、防雷接地系统等相关设备稳

30、定运行系统、防雷接地系统等相关设备稳定运行保证机房内各类设备和通信线路正常、稳定、高效保证机房内各类设备和通信线路正常、稳定、高效运行运行保证机房各类运行故障问题及时规范得到解决保证机房各类运行故障问题及时规范得到解决管理手段:管理手段:建立完善的规章制度,落实执行建立完善的规章制度,落实执行划分合理的角色,明确职责划分合理的角色,明确职责建立通畅的反馈机制,形成良性循环建立通畅的反馈机制,形成良性循环四、数据中心的运维管理四、数据中心的运维管理-制度管理制度管理重点内容:重点内容:管理机构:岗位设置、人员配置、授权与审批、沟管理机构:岗位设置、人员配置、授权与审批、沟通与合作、审核与检查通与

31、合作、审核与检查管理制度:制定与发布、评审与修订管理制度:制定与发布、评审与修订人员管理:人员录用、技能培训、绩效考核、外来人员管理:人员录用、技能培训、绩效考核、外来人员的管理人员的管理建设管理:需求分析、方案设计、产品采购、项目建设管理:需求分析、方案设计、产品采购、项目实施、工程验收实施、工程验收运维管理:环境管理、资产管理、设备管理、介质运维管理:环境管理、资产管理、设备管理、介质管理、监控管理、密码安全管理、安全事件管理、管理、监控管理、密码安全管理、安全事件管理、应急预案管理应急预案管理四、数据中心的运维管理四、数据中心的运维管理-制度管理制度管理1、管理机构、管理机构岗位设置:设

32、立专门的管理部门、负责人;设立岗岗位设置:设立专门的管理部门、负责人;设立岗位、定义职责、分工和技能要求位、定义职责、分工和技能要求人员配置:按岗位和工作负荷,配置机房环境管理、人员配置:按岗位和工作负荷,配置机房环境管理、系统管理、网络管理、安全管理人员;系统管理、网络管理、安全管理人员;AB角角授权与审批:明确审批事项、规范的审批程序;授权与审批:明确审批事项、规范的审批程序;沟通与合作:内部定期交流学习;加强与外围单位沟通与合作:内部定期交流学习;加强与外围单位的交流合作;加强与供应商、服务商的交流合作;的交流合作;加强与供应商、服务商的交流合作;审核与检查:规范检查内容、频率和指标性能

33、,发审核与检查:规范检查内容、频率和指标性能,发现异常及时采取必要的应对措施,定期分析统计现异常及时采取必要的应对措施,定期分析统计四、数据中心的运维管理四、数据中心的运维管理-制度管理制度管理2、管理制度:指导数据中心规范化运行管理,包括、管理制度:指导数据中心规范化运行管理,包括目标、范围、方针、原则和责任等。目标、范围、方针、原则和责任等。制定与发布:组织相关人员制定管理制度,统一格制定与发布:组织相关人员制定管理制度,统一格式规范,对初稿进行讨论修改后,经主管人员确认式规范,对初稿进行讨论修改后,经主管人员确认后发布。后发布。评审与修订:定期对管理制度进行过评审、修订和评审与修订:定期

34、对管理制度进行过评审、修订和完善,满足实际运行管理要求。完善,满足实际运行管理要求。四、数据中心的运维管理四、数据中心的运维管理-制度管理制度管理3、人员管理、人员管理人员招录:根据运行管理需要,招录具备岗位所需人员招录:根据运行管理需要,招录具备岗位所需技术技能人员,对招录人员说明其角色和职责。技术技能人员,对招录人员说明其角色和职责。技能培训:对新进人员进行上岗培训、定期开展内技能培训:对新进人员进行上岗培训、定期开展内部交流和专业技能更新培训,保证满足实际工作需部交流和专业技能更新培训,保证满足实际工作需要。要。绩效考核:定期对在岗人员进行技能考核和业绩考绩效考核:定期对在岗人员进行技能

35、考核和业绩考核,根据考核结果,加强教育谈话,必要时调整岗核,根据考核结果,加强教育谈话,必要时调整岗位。位。外来人员管理:外来人员进入机房需要经申请,领外来人员管理:外来人员进入机房需要经申请,领导批准,由专人全程陪同和监督,并记录备案。导批准,由专人全程陪同和监督,并记录备案。四、数据中心的运维管理四、数据中心的运维管理-制度管理制度管理4、建设管理:、建设管理:需求分析需求分析方案设计方案设计产品采购产品采购项目实施项目实施工程验收工程验收四、数据中心的运维管理四、数据中心的运维管理-制度管理制度管理5、运维管理:、运维管理:环境管理:机房供配电、空调、温湿度、人员出入环境管理:机房供配电

36、、空调、温湿度、人员出入资产管理:资产登记、分类、保管和使用资产管理:资产登记、分类、保管和使用设备管理:服务器、存储、网络线路的操作和维护设备管理:服务器、存储、网络线路的操作和维护介质管理:标识、保存、使用、管理和销毁介质管理:标识、保存、使用、管理和销毁监控管理:性能、健康、日志、策略监控管理:性能、健康、日志、策略安全事件管理:消防、供电、漏水等基础设施故障、安全事件管理:消防、供电、漏水等基础设施故障、网络中断、恶意攻击网络中断、恶意攻击应急预案管理:运用危机管理,根据可能风险,分应急预案管理:运用危机管理,根据可能风险,分类制定相关应急预案,并定期检查和演练。类制定相关应急预案,并

37、定期检查和演练。探讨四:探讨四:数据中心信息安全运维体系的建设数据中心信息安全运维体系的建设 一、信息安全运维体系的发展阶段一、信息安全运维体系的发展阶段信息系统运行维护占信息系统生命周期信息系统运行维护占信息系统生命周期70%-80%,信息安全运维体系的建设已经越来越被广,信息安全运维体系的建设已经越来越被广大用户重视。大用户重视。尤其是随着信息系统建设工作从大规模建设阶尤其是随着信息系统建设工作从大规模建设阶段逐步转型到段逐步转型到“建设和运维建设和运维”并举的发展阶段,政并举的发展阶段,政府或企业运维人员需要管理越来越庞大的府或企业运维人员需要管理越来越庞大的IT系统系统这样的情况下,信

38、息安全运维体系建设已经被提到这样的情况下,信息安全运维体系建设已经被提到了一个空前的高度上。了一个空前的高度上。一、信息安全运维体系的发展阶段一、信息安全运维体系的发展阶段对于政府或企业的信息安全运维服务管理的发对于政府或企业的信息安全运维服务管理的发展,通常可以分为五个阶段:混乱、被动、主动、展,通常可以分为五个阶段:混乱、被动、主动、服务和价值阶段。服务和价值阶段。混乱阶段:没有建立综合网管中心,没有用户混乱阶段:没有建立综合网管中心,没有用户通知机制;通知机制;被动阶段:开始关注事件的发生和解决,关注被动阶段:开始关注事件的发生和解决,关注信息资产,拥有了统一的运维控制台、故障记录和信息

39、资产,拥有了统一的运维控制台、故障记录和备份机制;备份机制;一、信息安全运维体系的发展阶段一、信息安全运维体系的发展阶段主动阶段:建立了信息系统安全运行的定义,主动阶段:建立了信息系统安全运行的定义,并将系统性能,问题管理、可用性管理、自动化与并将系统性能,问题管理、可用性管理、自动化与工作调度作为重点;工作调度作为重点;服务阶段:已经可以支持任务计划和服务级别服务阶段:已经可以支持任务计划和服务级别管理;管理;价值阶段:实现性能、安全和核心应用的紧密价值阶段:实现性能、安全和核心应用的紧密结合,体现信息系统运维服务价值之所在。结合,体现信息系统运维服务价值之所在。一、信息安全运维体系的发展阶

40、段一、信息安全运维体系的发展阶段目前,大多数政府部门或企业的信息安全运维目前,大多数政府部门或企业的信息安全运维体系的服务水平处在一个被动的阶段。体系的服务水平处在一个被动的阶段。这一阶段主要表现在信息技术和设备的应用越这一阶段主要表现在信息技术和设备的应用越来越多,但运维人员在信息系统出现故障或安全事来越多,但运维人员在信息系统出现故障或安全事件的时候却茫然不知所措。究其原因,是该组织未件的时候却茫然不知所措。究其原因,是该组织未建成完整的信息安全运维体系。建成完整的信息安全运维体系。一、信息安全运维体系的发展阶段一、信息安全运维体系的发展阶段通常安全运维包含两层含义:通常安全运维包含两层含

41、义:一是指在运维过程中对网络或系统发生病毒或一是指在运维过程中对网络或系统发生病毒或黑客攻击等安全事件进行定位、防护、排除等运维黑客攻击等安全事件进行定位、防护、排除等运维动作,保障系统不受内、外界侵害。动作,保障系统不受内、外界侵害。二是对运维过程中发生的基础环境、网络、安二是对运维过程中发生的基础环境、网络、安全、主机、中间件、数据库乃至核心应用系统发生全、主机、中间件、数据库乃至核心应用系统发生的影响其正常运行的事件(包含关联事件)通称为的影响其正常运行的事件(包含关联事件)通称为安全事件,而围绕安全事件、运维人员和信息资产,安全事件,而围绕安全事件、运维人员和信息资产,依据具体流程而展

42、开监控、告警、响应、评估等运依据具体流程而展开监控、告警、响应、评估等运行维护活动,称为安全运维服务。行维护活动,称为安全运维服务。一、信息安全运维体系的发展阶段一、信息安全运维体系的发展阶段被动的信息安全运维服务,存在以下弊端:被动的信息安全运维服务,存在以下弊端:出现故障纵有众多单一的厂商管理工具,但无法出现故障纵有众多单一的厂商管理工具,但无法迅速定位安全事件,忙于迅速定位安全事件,忙于“救火救火”,却又不知火因何,却又不知火因何而而“着着”。时时处于被动服务之中,无法提供量化的。时时处于被动服务之中,无法提供量化的服务质量标准。服务质量标准。政府或企业的信息系统管理仍在依靠各自的政府或

43、企业的信息系统管理仍在依靠各自的“业业务骨干务骨干”支撑,缺少相应的流程和知识积累,过多依支撑,缺少相应的流程和知识积累,过多依赖于人。赖于人。对安全事件缺少关联性分析和评估分析,并且没对安全事件缺少关联性分析和评估分析,并且没有对安全事件定义明确的处理流程,更多的是依靠个有对安全事件定义明确的处理流程,更多的是依靠个人的经验和责任心,缺少必要的审核和工具的支撑。人的经验和责任心,缺少必要的审核和工具的支撑。二、信息安全运维体系的建立步骤二、信息安全运维体系的建立步骤根据各单位自身情况,结合信息安全保障体系根据各单位自身情况,结合信息安全保障体系建设中运维体系建设的要求,遵循建设中运维体系建设

44、的要求,遵循ITIL(最佳实(最佳实践指导)、践指导)、ISO/IEC 27000系列服务标准、等级系列服务标准、等级保护和分级保护制度保护和分级保护制度,建立一整套信息安全运维,建立一整套信息安全运维服务管理体系。服务管理体系。第一步:建立安全运维监控中心第一步:建立安全运维监控中心 第二步:建立安全运维告警中心第二步:建立安全运维告警中心 第三步:建立安全运维事件响应中心第三步:建立安全运维事件响应中心 第四步:建立安全运维审核评估中心第四步:建立安全运维审核评估中心 第五步:以信息资产管理为核心第五步:以信息资产管理为核心 二、信息安全运维体系的第一步二、信息安全运维体系的第一步第一步:

45、建立安全运维监控中心第一步:建立安全运维监控中心实现对信息系统运行动态的快速掌握,以及运实现对信息系统运行动态的快速掌握,以及运行维护管理过程中的事前预警、事发时快速定位。行维护管理过程中的事前预警、事发时快速定位。其主要包括:其主要包括:集中监控集中监控:采用开放的、遵循国际标准的、可:采用开放的、遵循国际标准的、可扩展的架构,整合各类监控管理工具的监控信息,扩展的架构,整合各类监控管理工具的监控信息,实现对信息资产的集中监视、查看和管理的智能化、实现对信息资产的集中监视、查看和管理的智能化、可视化监控系统。可视化监控系统。监控的主要内容包括:基础环境、网络、通信、监控的主要内容包括:基础环

46、境、网络、通信、安全、主机、中间件、数据库和核心应用系统等。安全、主机、中间件、数据库和核心应用系统等。二、信息安全运维体系的第一步二、信息安全运维体系的第一步综合展现综合展现:合理规划与布控,整合来自各种不:合理规划与布控,整合来自各种不同的监控管理工具和信息源,进行标准化、归一化同的监控管理工具和信息源,进行标准化、归一化的处理,并进行过滤和归并,实现集中、综合的展的处理,并进行过滤和归并,实现集中、综合的展现。现。快速定位和预警快速定位和预警:经过同构和归并的信息,将:经过同构和归并的信息,将依据预先配置的规则、事件知识库、关联关系进行依据预先配置的规则、事件知识库、关联关系进行快速的故

47、障定位,并根据预警条件进行预警。快速的故障定位,并根据预警条件进行预警。二、信息安全运维体系的第二步二、信息安全运维体系的第二步第二步:建立安全运维告警中心第二步:建立安全运维告警中心基于规则配置和自动关联,实现对监控采集、基于规则配置和自动关联,实现对监控采集、同构、归并的信息的智能关联判别,并综合的展现同构、归并的信息的智能关联判别,并综合的展现信息系统中发生的预警和告警事件,帮助运维管理信息系统中发生的预警和告警事件,帮助运维管理人员快速定位、排查问题所在。人员快速定位、排查问题所在。同时,告警中心提供多种告警响应方式,内置同时,告警中心提供多种告警响应方式,内置与事件响应中心的工单和预

48、案处理接口,可依据事与事件响应中心的工单和预案处理接口,可依据事件关联和响应规则的定义,触发相应的预案处理,件关联和响应规则的定义,触发相应的预案处理,实现运维管理过程中突发事件和问题处理的自动化实现运维管理过程中突发事件和问题处理的自动化和智能化。和智能化。二、信息安全运维体系的第三步二、信息安全运维体系的第三步第三步:建立安全运维事件响应中心第三步:建立安全运维事件响应中心借鉴并融合了借鉴并融合了ITIL(信息系统基础设施库)(信息系统基础设施库)/ITSM(IT服务管理)的先进管理规范和最佳实服务管理)的先进管理规范和最佳实践指南,借助工作流模型参考等标准,开发图形化、践指南,借助工作流

49、模型参考等标准,开发图形化、可配置的工作流程管理系统,将运维管理工作以任可配置的工作流程管理系统,将运维管理工作以任务和工作单传递的方式,通过科学的、符合运维管务和工作单传递的方式,通过科学的、符合运维管理规范的工作流程进行处置,在处理过程中实现电理规范的工作流程进行处置,在处理过程中实现电子化的自动流转,无需人工干预,缩短流程周期,子化的自动流转,无需人工干预,缩短流程周期,减少人工错误,并实现对事件、问题处理过程中的减少人工错误,并实现对事件、问题处理过程中的各个环节的追踪、监督和审计。各个环节的追踪、监督和审计。二、信息安全运维体系的第四步二、信息安全运维体系的第四步第四步:建立安全运维

50、审核评估中心第四步:建立安全运维审核评估中心该中心提供对信息系统运行质量、服务水平、该中心提供对信息系统运行质量、服务水平、运维管理工作绩效的综合评估、考核、审计管理功运维管理工作绩效的综合评估、考核、审计管理功能。能。二、信息安全运维体系的第五步二、信息安全运维体系的第五步第五步:以信息资产管理为核心第五步:以信息资产管理为核心 IT资产管理是全面实现信息系统运行维护管理资产管理是全面实现信息系统运行维护管理的基础,提供丰富的的基础,提供丰富的IT资产信息属性维护和备案资产信息属性维护和备案管理,以及对业务应用系统的备案和配置管理。管理,以及对业务应用系统的备案和配置管理。基于关键业务点配置

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁