《云计算平台工程建设方案.doc》由会员分享,可在线阅读,更多相关《云计算平台工程建设方案.doc(110页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、云计算平台工程建设方案 基于本期XX单位XX云计算平台的建设思路一一搭建基于IaaS层面的云计算平台,如何采用云计算技术建立动态的IT资源平台,并使之具备快速IT服务交付能力,进而通过动态的IT架构来应对有关省直单位XX业务发展的需要;将应用和业务从底层的IT资源中分离出来,提高系统的可移植性,并能够充分利用更加优化的系统和网络资源以提高效率、降低整体成本是本期建设方案需要重点解决的问题。 为此,我们建议以XX应用系统为顶层架构来搭建XX单位XX云计算资源池,它是由计算资源池、存储资源池、网络资源池、XX应用程序以及运营管理平台共同组成,运营管理平台负责对资源池和应用进行管理调度及告警监控。其
2、组成框架如下图所示。图3:资源池组成框架图以下针对XX云计算资源池的各组成部分分别进行具体阐述。1.1. 网络资源池1.1.1. 组网物理拓扑图 XXXX云计算平台组网物理拓扑如下图所示:图4:XX云计算平台组网物理拓扑图本工程新增3根移动专线接入,单根200Mpbs带宽。一根为XX互联网接入区对外提供服务用,一根用于VPN专线,一根用于XX办公人员访问互联网使用。 整个云计算平台在组网设计上满足双网双平面结构,从网络接口、网络链路到关键网络设备均配置冗余部件。在网络接口上每台物理服务器至少配置3张网卡,分别用于业务服务、虚拟化平台宿主机管理、IP存储系统互联。业务服务网络根据业务属性不同,通
3、过MPLS VPN划分为公用网络区、互联网接入区、专用网络区。虚拟化计算资源可以在不同的网络区域中自由迁移。 在汇聚层旁挂防火墙、隔离网闸、运维审计、数据库审计系统等安全设备。其中防火墙用于实现同一网络区域中不同业务系统的之间的安全隔离;隔离网闸用于在MPLS VPN隔离的不同网络区域之间进行安全数据交换,同时用于XX和XX之间的数据安全交换。1.1.2. 网络负载均衡设计 网络负载均衡分链路负载均衡和本地负载均衡,总体逻辑示意图如下图所示:图5:网络负载均衡示意图1.1.2.1. 链路负载均衡设计 如上图所示,将移动互联网专线和电信互联网专线接入链路负载均衡器,链路负载均衡器通过对所有Int
4、ernet链路进行流量路由和控制带宽服务水平实现多互联网接入的高可用性。链路负载均衡器将多条互联网线路进行虚拟化处理,保障用户从最好的线路访问内外部资源。任意一条ISP线路中断,都不会对服务造成任何影响。通过链路负载均衡器可实现ISP接入线路的无缝扩展。 1) OutBound流量负载均衡 XX办公人员访问互联网的流量到达链路负载均衡器时,将通过链路负载均衡器多种链路状态检测结果选择最佳出口链路,提升用户体验。 2) InBound流量负载均衡 为使移动用户和电信用户通过不同互联网链路访问互联网接入区应用系统,链路负载均衡器的智能DNS解析功能将不同用户访问的域名解析成不同的公网IP地址,加速
5、应用访问,提升用户体验。1.1.2.2. 本地负载均衡设计 本工程新增本地负载均衡器两台,旁挂于汇聚交换机。实现对服务器的负载均衡。本地负载均衡器可以保障内部资源的容错性,内部任何一个应用节点出现问题都不会对用户造成任何的影响,本地负载均衡器能够自动的屏蔽有问题的应用节点,让其停止对外服务,同时把该故障节点上的用户迁移到其他正常的节点上去。 汇聚层本地负载均衡器可以虚拟成为多个设备,满足XX不同分区的安全隔离要求。 XX业务系统以B/S架构为主,目前的WEB应用都包含了大量的图片,javascript,CSS文件等,这些文件的重复传输不但给服务器造成了压力,同时也使得用户的体验受到了影响。本地
6、负载均衡器通过HTTP压缩的方式来节省带宽以及提高访问速度。通过静态文件和动态文件的cache文件压缩,浏览器端文件cache控制等优化技术,来提供对WEB应用进行加速,提高用户访问速度。使用本地负载均衡器开放的API接口可以实现和云计算管理平台的集成。1.1.3. 网络虚拟化设计1.1.3.1. 云计算对传统网络的挑战 传统的网络规划设计依据高可靠思路,形成了冗余复杂的网状网结构,结构化网状网的物理拓扑在保持高可靠、故障容错、提升性能上有着极好的优势,是通用设计规则。云计算的大规模运营,给传统网络架构和传统应用部署都带来了挑战,新一代网络支撑这种巨型的计算服务,不论是技术革新还是架构变化,都
7、需要服务于云计算的核心要求,动态、弹性、灵活,并实现网络部署的简捷化。具体来说传统网络面临的挑战主要有以下几点: 一一传统网络的复杂性在实际的运维中,管理人员承担了极其繁冗的工作量; 一一云计算平台下多虚拟机部署在同一台物理服务器上运,服务器的利用率从20%提高到80%,服务器端口流量大幅提升,对网络性能提出更高要求;一一云计算平台中,虚拟机在物理服务器之间进行迁移,为了避免虚拟机迁移后路由的震荡和修改网络规划,迁移通常只在在二层域进行,因此云计算平台需要具备一个性能更高、二层域更大的网络环境为迁移提供保障。通过分析云计算对传统网络基础架构带来的挑战,我们可以从两个方面来应对。一是通过构建高性
8、能、高可靠的网络,从而满足云计算给网络带来的压力;二是通过构建虚拟化网络来满足云计算中由于虚拟机部署、迁移、以及安全策略实施对网络提出的灵活性、安全性的要求。 总的来说,为满足云计算的业务要求,统一的基础网络要素必然包括:高性能交换、虚拟化应用、透明化交换。1.1.3.2. 高性能二层网络 为提供一个性能更高、二层域更大的网络环境,本工程新增核心交换机和汇聚交换机通过交换机虚拟化技术(华三IRF2、思科VSS)分别虚拟成一台逻辑设备,减少了设备节点,简化了配置。通过跨设备链路聚合技术取代传统部署方式中的STP+VRRP协议,使网络拓扑变得简洁,具备更强的扩展性;同时,其毫秒级的故障收敛时间,为
9、虚拟机迁移提供了更加宽松的实现环境。图6:交换机横向虚拟化经过二层透明化改造后,云计算平台的汇聚接入层是一个透明二层网络。不同业务(虚拟服务器)接入不同的二层VLAN,但同一个业务(虚拟服务器)可以在不同网络分区里灵活部署与迁移,满足了云计算的要求;同时,汇聚层以上进行的是VPN标签交换与路由转发,又保证了不同业务(虚拟服务器)的安全隔离。1.1.3.3. 网络服务虚拟化 为满足不同XX分区的安全隔离要求,本项目在云计算平台的汇聚层部署有汇聚交换机、防火墙、IPS、负载均衡器等设备。传统网络下,将为不同分区单独配置一套安全设备,设备利用率低,运维管理复杂。在云计算平台下,通过网络服务虚拟化,统
10、一建设一套性能强大、可扩展性良好的网络服务设备,满足为不同分区提供安全、应用加速等服务。图7:1:N网络虚拟化技术 汇聚层交换机也通过虚拟化技术多实例,每个模拟出的交换机都拥有它自身的软件进程、专用硬件资源(接口)和独立的管理环境,可以实现独立的安全管理界限划分和故障隔离域。有助于将分立网络整合为一个通用基础设施,保留物理上独立的网络的管理界限划分和故障隔离特性,并提供单一基础设施所拥有的多种运营成本优势。如下图所示:图8:交换机纵向虚拟化1.1.3.4. 虚拟交换机技术1) VMware VMware分布式虚拟交换机功能满足网络分区条件下,虚拟主机在线迁移等功能时,保证业务网络的持续性。 虚
11、拟交换机是构成虚拟平台网络的关键角色,VMware虚拟化通过VMware vNetwork Distributed Switch,使虚拟机跨多个主机移动时始终处于同一个VLAN内,它为虚拟机在物理服务器之间移动时监视和保持其安全性提供了一个框架。VMware vNetwork Distributed Switch示意图如下所示: 图9:VMware vNetwork Distributed Switch示意图 在多网络分区环境时,VMware通过虚拟交换机的VLAN TRUNK,当一个端口启用了TRUNK功能后,就具备端口聚合的功效,会自动检测流向此端口的所有流量,并把不同VLAN的流量导向物
12、理交换机上相应的VLAN中。在一台ESX主机上由多个千兆网卡绑定在一起(组合成vSwitch)提供VM对外通讯的流量,并与物理交换机上的多个启用了TRUNK功能的端口相连接。此时VMs分别在VLAN l、VLAN2、VLAN3上,同时在物理交换机上也有同样ID的VLAN。那么,在VLAN1中的虚拟机,就可以和与物理交换机上VLAN1中的端口相连的机器相互通讯。同时实现虚拟化服务器在多网络分区间的动态迁移。2)XEN通过将OPEN vSwitch(开放虚拟交换标准)作为其默认组件,自xenserver5.6 FPI就实现对虚拟交换机的支持,而且自verxenserver5.6 SP2开始也实现了
13、分布式的虚拟交换机功能。Xen-Motion是 Citrix Xenserver 的动态迁移技术,当然,该系列4款虚拟化产品中,目前只有最高等级的白金版和企业版才具备这项功能,至于标准版及完全免费的Express精简版则无此项能力。不但是CITRIX旗下的虚拟化产品,其他基于Xen技术开发出来的虚拟化产品,例如Virtual Iron,也具备相似的动态迁移功能 LiveMigrate,除了免费提供的个人版之外,需要付款购买的企业版及企业加强版具有内置该项功能。1.1.4. IP地址及DNS规划XXXX云计算平台新增两个独立网段,一个用于云平台及虚拟机宿主机之间通信,一个用于云计算平台内IP存储
14、系统网互联;业务系统的IP地址和NDS规划,沿用当前XX统一规划。具体参考实施意见XXXXIP地址规划及管理规范和XX政府外网DNS及设备命名规范。1.1.4.1. IP地址规划原则XX单位XXIP地址规划遵从国信办和国家外网工程办有关规定和指导意见。XXIP直至规划原则包括:IP地址规划主要涉及到网络资源利用的方便有限的管理网络的问题,公有地址相对紧张的情况下,合理有效的利用IP地址成为IP地址规划的主要问题,合理的IP地址规划是有利于网络管理的;IP地址的合理分配是保证网络顺利运行和网络资源有效利用的关键。对于外网广域骨干网IP地址的分配应该采用国家XX工程办分配的合法地址空间,充分考虑到
15、地址空间的合理利用,保证实现最佳的网络内地址分配及业务流量的均匀分布;IP地址的规划和划分应该考虑到网络的后续规模和业务上的发展,能够满足未来发展的需要;既要满足本期工程对IP地址的需求,同时要充分考虑未来的业务发展,预留相应的地址段;IP地址的分配需要有足够灵活性,能满足各种用户接入需要;地址分配是有业务驱动,按照业务量的大小分配各地的地址段;IP地址的分配必须采用VLSM(变长掩码)技术,保证IP地址的利用效率;采用CIDR技术,这样可以减小路由器路由表的大小,加快路由的收敛速度,也可以减小网络广播的路由信息的大小;充分合理利用已申请的地址空间,提高地址的利用效率;IP地址的规划应该是XX
16、广域骨干整体规划的一部分,即IP地址规划要和网络层次规划、路由协议规划、流量规划等结合起来考虑。IP地址的规划应尽可能和网络层次相对应,应该是自顶向下的一种规划。1.1.4.2. IP地址规划总体规划 根据国家外网工程办的规定,XXXX云平台的公用网络区使用国家申请的IP地址范围为:XXXXXX。 互联网区供互联网访问的设备的IP目前有省电信、省移动提供外 网地址,数量考虑上留有余地。互联网区XX移动提供有3根互联网专线,每条专线提供一个C类外网IP地址段,共3个C类地址段供本平台使用。 XX单位XX横向需要互联各个政府部门,纵向需要打通省,设区市、县、乡镇(街道)四级部门单位,在外网地址规划
17、中,使用综合地址规划方案,采用公有地址和私有地址双轨并行的办法,在公有地址不够时,允许采用私有地址作为部门单位的XX业务地址。 XX承载三种不同的网络业务,为了最大程度地减少不同网络业务区IP地址空间的重叠,XXXXIP地址总体规划如下:网络业务区地址空间(建议的)用户地址空间公用网络区互联网接入区专用网络区云计算平台管理云计算平台存储IP网络 业务地址从相应的业务网络区地址空间中划分。 1.1.4.3. DNS域名体系结构 XX单位XX升级和社区市网络分别采用独立的三级域名。 域名由根域和若干个子域名用“.”连接而成,作为根域名,采用作为省网三级域名,采用作为各设区市三级域名。各级政府组成部
18、门咋XX设置服务器后,应将服务器的IP地址和对应的域名在省电子网XX管中心注册。 域名以4-5段为主,原则上不超过5段。如:“主机名.单位名”;由省数据中心建立域名()管理中心,所有单位的域名及DNS均向XX网管中心域名册;可在9个设区市市分别建立子域();各单位若需注册,需在XX外网管理中心备案之后向国家外网管理中心注册。1.1.4.4. 集成智能DNS系统 本工程新增2台链路负载均衡器,实现智能DNS解析功能。XX互联网接入区应用系统的DNS域名系统需与链路负载均衡器的智能DNS系统进行集成。通过对系统原有DNS授权域服务器配置进行修改,将动态记录委派到链路负载均衡器上进行解析,再返回给发
19、起DNS请求的用户。根据解析结果引导用户请求到不同的运营商链路,实现就近访问。1.1.4.5. 网络安全域划分与隔离 根据国家XX所承载的业务和系统服务类型的不同,在逻辑上,将国家XX划分为公用网络区(Global)、 专用网络区(VPN)和互联网接入区(Internet)三个功能域, 分别提供国家XX互联互通业务、专用VPN业务和互联网业务。图10:XXMPLS VPN分区示意图 公用网络区:采用国家XX公用地址(即从NNNIC注册的地址)的网络区域,是国家XX的主干道,实现各部门、各地区互联互通,为跨地区、跨部门的业务应用提供支撑平台。 互联网接入区:是各级政务部门通过逻辑隔离手段安全接入
20、互联网的网络区域,满足各级政务部门公共服务业务应用的需要。 专用网络区:是依托国家XX基础设施,为有特定需求的部门或业务设置的VPN网络区域,实现不同部门或不同业务之间的相互隔离,VPN网络区域主要为少数部门的特定业务数据传输提供安全通道。通过MPLS VPN技术运用,三个业务区之间逻辑隔离,不能互访。升级XX数据中心分为四个区,这四个区分属于三个业务隔离区,对应关系如下表:某些业务系统需要跨公用网络区和互联网接入区部署,也有些需要跨专用网络区和互联网接入区部署,为了保证安全,需要进行逻辑隔离,在公用网络区和互联网接入区间部署一个网闸,同时在专用网络区和互联网接入区也部署一个网闸。 除以上从业
21、务系统层划分为公用网络区、专用网络区、互联网接入区外,还需为云计算平台管理和IP存储子系统划分2个独立网络区域,实现业务网络、管理网络、IP存储网络的安全逻辑隔离。1.1.5. 网络端口资源估算 关于汇聚层交换机端口配置,接入服务器建议用千兆以太网电口,网络设备间互联用万兆以太网口。 本期新增机架服务器XX台,单台服务器配置XX千兆以太网电口,共需XXX口千兆以太网电口,刀片服务器XX台,占用X个刀片服务器机框,每机框对外XX口千兆以太网电口,共XX口,合计连接服务器需要XXX口千兆以太网电口; 汇聚交换机与防火墙、负载均衡器等汇聚网络设备需等需要万兆口互联,考虑一定端口冗余,本期建议配置X台
22、汇聚交换机, 单台配置10/100/1000M电口不少于XX个; 千兆光口不少于XX个、万兆以太网光口不少于XX个并配置相应数量多模光纤模块。1.2. 计算资源池1.2.1. 计算资源池架构服务器虚拟化技术很好地解决了传统服务器系统建设的问题,通过提高物理服务器利用率大幅度消减物理服务器购置需求、数量和运营成本;通过利用服务器虚拟化中CPU、内存、I0资源的动态调整能力实现对业务应用资源需求的动态响应,提升业务应用的服务质量;通过在线虚拟机迁移实现更高的可用性和可靠性以及各种基于资源优化或节能减排策略的跨物理服务器的调度等等。因此,服务器虚拟化技术是新一代数据中心最理想的解决方案。服务器虚拟化
23、架构设计是服务器虚拟化技术运用的核心,直接决定了整个服务器资源体系对应用系统的承载能力、运行效率以及可靠性。XX云计算资源池由机架式服务器、刀片服务器构成;刀片服务器通过服务器虚拟化部署一般业务系统和web应用系统。 机架式服务器用于部署管理平台和高负载数据库服务器等。服务器虚拟化架构图如下所示:图 11:XXMPLS VPN分区示意图1.2.2. 应用系统分析经前期需求调研分析,根据业务特点将XX平台所承载的应用系统分为大访问量应用系统、大计算量应用系统、大数据量应用系统三类。1.2.2.1. 大访问量应用系统大访问量应用系统如政府门户网站、气象查询等web类应用系统,这类应用的特点是业务逻
24、辑简单,不同业务请求互不关联,但请求的并发量根据业务特点不同可能很大,如水利信息网在灾害天气下访问量将剧增。大访问量应用系统要求对大量互不关联的并发请求进行快速响应。这种情况下,需要应用服务器有足够数量的线程响应请求,而单个线程计算量不大,因而对单个CPU处理性能要求不高,可通过提供足够CPU用服务器数量来满足需求。XX云计算平台通过虚拟化技术为大访问量应用系统部署是大小配置的虚拟机作为应用服务器,多应用服务器工作在负载均衡模式,提升用户使用体验。大访问量应用系统对数据库要求不高,配置一般虚拟机即可满足要求。1.2.2.2. 大计算量应用系统 大计算量应用系统如数字城管、GIS地理信息系统等复
25、杂信息处理系统,这样应用的特点是计算量较大、运算复杂、内存需求大,对服务器计算性能要求高。建议配置单一高性能虚拟服务器。大计算量应用系统对数据库要求不高,配置一般虚拟机即可满足要求。1.2.2.3. 大数据量应用系统 大计算量应用系统流动人口管理、社保管理系统等。根据数据库储存模式不同,可分为文件型和数据库的系统。 数据库型大量数据量应用系统要求较高性能数据库服务器。建议配置强大的数据库服务器,提供足够的CPU、Memory及IO性能来处理大量的数据,根据应用系统重要级别,数据库服务器可以选用虚拟物理器或物理服务器,应用服务器业务逻辑简单,对配置要求不高,配置 虚拟机即可满足要求。 文件型大数
26、据两应用系统基础数据量大,通过传统的集中储存方式,存储并发读写IO能力无法满足计算资源要求,建议通过并行计算模型实现。根据业务计算特点,服务器可灵活选择虚拟机或物理服务器。1.2.3. 计算资源池建议配置与选型建议1.2.3.1. 计算资源池建议配置 经咨询H3C、IBM、HP、微软、红帽、VMware等行业主流云计算常商,云计算平台的建设,从避免浪费和规模效应的角度考虑,最佳实践经验是从50台物理服务器的规模开始建设,然后根据实际业务发展情况按需扩容、滚动建设。本期工程以XX单位XX的实际情况为基础参照行业主流云计算厂商的建议进行设计考虑。考虑不同业务系统的负载差异,本期工程同时配置刀片服务
27、器和机架式服务器。 参考各厂商建议,用作WEB服务器时,一台物理服务器最多可以虚拟12台虚拟机;用作应用服务器时,一台物料服务器最多可以虚拟7台虚拟机.。本工程,刀片服务器按照每台虚拟10台虚拟机,刀片服务器虚拟化后的虚拟机建议部署一般web/应用服务器;高性能服务器按照每台虚拟8台虚拟机,高性能服务器虚拟化后的虚拟机建议部署重载应用/数据库服务器。 统筹考虑不同应用系统对硬件资源的需求差异,建议配置刀片服务器XX套,2路机架式服务器X台,4路机架式服务器XX台。 其中X台2路机架式服务器用于云计算管理平台,X台4路机架式服务器作为测试服务器(计划用来支持各类移动办公等移动应用,统一纳入XX单
28、位信息中心监控管理)。计算资源池刀片服务器和4路机架式服务器组成,其中XX台刀片服务器可以虚拟化为XXX台虚拟机,XX台高性能机架式服务器可以虚拟化XXX台虚拟机,平台共计XXX台虚拟机。 一般应用系统需要web服务器、应用服务器各2台,采用应用负载均衡做集群,数据库服务器2台做互备,共需6台虚拟机。对于大型数量应用,大型数据库可直接部署在高性能物理服务器,通过多实例共享面向不同业务系统提供数据库管理平台服务,则需4台虚拟机和共享使用两台物理服务器。 按此测算,本期建设规模在满足50个部门50套应用系统需求之外还能有一定的冗余,冗余的资源可以用于安装数据备份软件、目录服务器、安全软件等平台相关
29、软件外,同时作为备用资源。今后还可以视实际需求增加计算资源,同步配套建设网络资源、存储资源及信息安全设备等,按照需扩容、滚动建设的方式满足省直部门的需求。 本期新增计算资源配置如下图表所示: 此外,每台物理服务器要求配置不少于3个千兆以太网电口,分别用于虚拟化平台管理口、应用系统对外提供服务、连接NAS 存储设备。 未来实际应用中,还将根据各厅局的复杂性,比如高吞吐量、高计算、高访问量类业务系统对计算资源的需要进行调整。1.2.3.2. 服务器选型建议 宿主机服务器架构是虚拟化架构的关键组件,也是服务器整合比例和成本分析的重要变量。宿主机服务器处理大量整合服务器的工作负载的能力会提高整合比例并
30、有助于提供满足需要的成本收益,以下提供二种宿主机服务器的参考架构。 宿主服务器的系统架构是指对服务器硬件自身的一般分类,例如包括机架式服务器、刀片式服务器。在选在系统架构时,首先要考虑的原则是每个宿主机将运行包含多种负载的多个客户机。处理器、内存、存储和网络能力以及高速的I/O和低延迟都很关键,重要的是要保证这些分类中的每一个宿主机服务器能够提供所需要满足的处理能力。 A)标准机架式服务器最常见的系统架构是标准机架式服务器。典型的是2U或4U的型号,这些服务器一般包含2到4个CPU插座,2到8个PCIE或PCIX插槽,4到6个硬盘托架。由于其在2和4个插座服务器商品中的低成本,以及通过增加网卡
31、和HBA插槽提供与生俱来的可扩展性,机架式服务器是虚拟宿主机服务器的最佳选择。B)刀片式服务器随着对能力和服务器密度不断增加的需求,刀片式服务器在普及程度和能力上都获得了显著的提高。在选择刀片服务器时,需要考虑刀片式架构中的每个刀片所包含CPU数及最大内存。对于每个宿主机服务器用于支持一定数量的客户机所需的网络和存储I/O必须加以仔细考虑,以保证刀片上运行的每个宿主机服务器和刀片底盘自身能够提供支持。1.2.4. 计算资源池部署1.2.4.1. 应用服务器部署应用服务器可部署在虚拟机系统(VM)和物理PC服务器。当应用服务器负载接近单台物理服务器性能时,可直接部署于物理服务器,一般应用服务器部
32、署在虚拟机上。根据应用系统的可用性要求等级不同,在虚拟机上实现高可用的方式有以下三种,虚拟机热迁移,虚拟机HA,物理机HA。虚拟机热迁移用于满足计划内停机维护操作。当服务器需要停机执行维护操作时,可通过虚拟机热迁移功能,将某一物理服务器上的虚拟机动态迁移至另一物理服务器。动态迁移过程,业务不中断,不影响用户的正常访问。虚拟机HA用于满足一般应用服务器计划外宕机。当发生服务器故障时,通过虚拟机HA,虚拟机可在其他的物理服务器上自动重启,实现故障转移。此过程会引起短暂业务中断,业务中断时间由虚拟机操作系统在另一物理服务器上启动的时间及应用系统启动的时间决定。通过虚拟机HA比传统群集较少一半的服务器
33、数量,在保证了一定高可用的同时提高资源利用率。对于直接 部署在物理服务器的应用系统,可通过高可用群集软件提供可用性保证。在windows系统可配置MSCS群集,在redhat Linux操作系统可配置VCS群集。通过部署高可用群集,在确保在物理服务器故障或应用故障时,进行快速的故障转移,减小并消除业务中断带来的负面影响。为了能够提供具有更高可扩展性和可靠性的应用平台,并能够在服务器集群中只能地分配负载,从而确保客户最大限度地发挥其应用服务器投资价值,结合硬件负载均衡设备,为部署在应用服务器上的服务和应用提供最佳的可扩展性和性能。1.2.4.2. 关键数据库部署数据库服务区作为业务系统的数据处理
34、平台,对服务区的I /O处理能力、内存、CPU等有较高要求的,建议采用高性能机架式服务器部署,不同的业务系统数据库可通过多实例进行共享同一物理服务区群集。对服务器性能要求一般的数据库管理系统可部署在虚拟机上。数据库服务器做业务系统的核心节点,为了保障其的高可用性,建议至少使用2台物理服务器或2台虚拟机做HA。部署虚拟机上数据库管理系统可通过Application HA保证其高可用;部署于物理服务器的数据库管理系统可通过VCS、MSCS或数据库管理系统自带群集软件(RAC)实现其高可用。1.2.5. 虚拟化软件选型分析目前主流虚拟化平台(Hypervisor)主要有以下四种,分别是VMware
35、vSphere、MicroSoft Hyper-V、KVM和Xen。其中KVM和Xen为开源产品。目前部分厂商根据开源Xen开发出自己的虚拟平台,如 Critix公司的 XenServer。 从虚拟化软件的成熟度来看,VMware经多年的市场经验,产品成熟稳定、功能也最为强大。开源KVM、开源XEN来源于开源社区,功能单一;基于开源Xen的Citrix XenServer,其功能、稳定性、可靠性优于开源Xen。 XX虚拟化平台的建设充分考虑产品的成熟性、稳定性和开放性。通过以上比较分析,VMware产品成熟、功能完善,为目前虚拟化市场的主流产品,但其采购成本较高;基本开源Xen的部分国产产品功
36、能不及VMware,但具有更好的性价比,作为国产虚拟化平台,其安全性也更有保证。充分考虑技术成熟度和开放性,本项目建议配置VmwareXX套、国产开源虚拟化软件XXX套,建成一个稳定、开放、支持异构的基础虚拟化平台。 当前关键应用建议部署在成熟稳定的VMware虚拟化平台上,非关键应用及测试环境可部署于国产开源虚拟化平台上。随着国产虚拟化平台的逐步成熟,在后续扩容中将逐步减少VMware在XX云计算平台的比重。1.2.5.1. 虚拟化管理平台 本期计算资源池采用X86服务器,虚拟化平台管理软件需实现高可用性、动态迁移,对整个应用架构实现统一的安全控制和权限管理。 目前X86虚拟化平台管理软件主
37、要有两大类: 一类为虚拟化平台原厂提供的。如VMware虚拟化管理平台VMware vCenter、Citrix XenServer虚拟化管理平台Xen Center、Hyper-V虚拟化管理平台Azure,Redhat KTM管理平台redhat RHEVM的。各厂商的虚拟化管理平台均可较好地管理自家虚拟化平台,管理平台开放必要的API接口。但是各个厂商均只能管理自己的Hypervisor,不能管理其它厂商的Hypervisor。 另一类是由第三方厂商提供的。如移动大云等,这等虚拟化平台管理软件的优点是可以实现多家虚拟化平台的统一管理,但在专用性方面不如各原厂提供的管理软件。1.2.5.2.
38、 容灾方案说明根据设计原则分布实现云平台系统的容灾方案:1、第一步实现云平台存储级容灾系统,通过新购虚拟存储网关,整合现有异构SAN存储资源池,存储结构化数据,实现存储虚拟化功能,并可满足数据迁移、容灾等功能,实现容灾。该步骤实现又可分为两步走,即先建立同城同步容灾,再建立城际两地三中心的容灾。在容灾中心新购买一套虚拟存储网关,容灾中心的存储设备可以与生产中心同构或异构,通过光纤交换机构成一个基于存储区域网(SAN)的基础架构平台。不仅提供容灾系统使用,也是容灾中心的统一SAN平台。在容灾中心存储上按照生产中心实际存储部署情况,依照存储性能相同的原则进行存储设备的逻辑划分,每台存储设备分别连接
39、到2台光纤交换机上,这久保证了存储设备在整个链路上冗余、不存在单点故障。在同城容灾方案中通过虚拟存储网关同步复制技术,由虚拟存储网关将生产中心的数据实时复制到容灾中心,确保生产中心的各种数据能同步复制到容灾中心的存储上。在两地三中心或两站地城际容灾方案中通过虚拟存储网关异步复制技术,准时将生产中心数据复制到容灾中心,灾难发生时仅涉及数十秒的数据丢失。可同时在容灾中心配置两台服务器,进行数据验证工作。利用虚拟存储网关快照功能对容灾中心的复制数据(只读)产生快照卷,挂载到验证服务器上进行访问验证。2、第二步实现云平台应用级容灾。在容灾中心配置相应的服务器池链接容灾存储。当灾难发生或进行灾难恢复演练
40、时,停止容灾复制关系后,容灾中心服务器池的虚拟机可以访问容灾数据并接管生产。制定接管计划,包括人员支持,网络支持,恢复计划,演练计划等,建立完善的全人工干预接管机制。3、第三步结合云平台管理和业界自动化远程容灾软件实现高度自动化的容灾体系,争取实现数小时内的容灾接管能力。1.3. 云计算管理平台 云计算管理平台包括云资源管理平台、云连营管理平台、网络管理平台。云资源管理平台包括IT基础架构中的物理资源和虚拟资源的管理,其中虚拟计算资源的管理集成厂商的云平台;云运营管理平台含业务管理模块和运营管理模块。云计算管理平台总体架构如下:图12:云管理平台架构图1.3.1. 云资源管理平台建设方案 整个
41、复杂的云计算架构中,必须通过一个强大的管理平台来实现对硬件资源的整合和虚拟化,对功能服务器的模板制作与部署,对云计算资源进行启动、停止、删除、回收等,对整个云计算平台运行性能进行实时监控和日志报告等功能,同时还实现用户交换接口,用户可以方便地登录到云计算平台,申请各种硬件资源和中间件资源,启动、停止自己功能服务器功能。这样打破了业务应用对资源的=独占的方式,实现硬件资源和软件资源的统一管理、统一分配、统一部署、统一监控和统一备份。 考虑到XX中的3个区(专用网络区、公共网络区、互联网接入区)之间是通过MPLS VPN相关隔离,为了实现云计算平台对3个区的统一管理,我们建议将宿主机的管理口(统一
42、设置宿主机上某一个单独物理网卡用于云计算管理平台对虚拟机的管理通讯)进行统一VLAN规划,通过此方式可以实现不同分区的虚拟机在同一个资源组中迁移和统一管理。 云资源管理平台主要由以下两个模块组成:云资源管理系统云计算服务Portal。图13:云资源管理功能模块图1.3.1.1. 云资源管理系统云资源管理系统其通过虚拟化技术和基于策略的自动化管理技术,构成虚拟化资源池,实现对物理资源、虚拟资源的统一管理和分配。云资源管理系统架构需要实现功能:1、设备管理提供对物理设备的接入和管理功能,包括设备发现展示、配置部署、告警上报等。2、虚拟适配层提供对不同虚拟层(VMM)的适配、集成能力,如VMware
43、、Xen、KVM、Hyper-V等,对上层屏蔽不同虚拟层差异,提供统一的虚拟化管理接口。3、云适配层提供对不同云资源的适应能力,实现公有云和私有云资源的统一管理能力。4、虚拟化资源池管理实现计算、存储和网络的虚拟化和资源统一管理。5、资源池调度提供资源动态分配,动态耗能管理、调度策略管理、资源池高可用性和备份恢复等功能。6、资源池服务对外提供基础资源池服务能力,如动态伸缩、负载均衡等。7、对外接口对外提供标准的接口和能力,供上层业务或解决方案集成。8、管理系统运资源池的统一管理维护功能,如用户管理、日志管理、告警和性能监控。其功能特性:1、资源池统一管理和高效利用u 物理机、虚拟机统一管理和调
44、度采用虚拟计划技术、分布式计算和存储等技术,实现资源的池化管理。云计算平台管理系统不仅能管理虚拟机,也能管理物理机,各种资源通过统一的对外接口进行管理和调度。图14:资源池管理示意图1图15:资源池管理示意图2n 动态节能云计算平台管理系统通过对业务忙闲交错和峰谷交错的特点分析,通过将闲的、处于低谷的业务进行迁移,从而清理出一些机器将其关闭,达到节能的效果。图16:资源池管理示意图32、自动化部署能力n 物理设备自动发现,即插即用物理设备从接入资源池到纳入资源池统一管理的过程自动化实现,将需要人工干预的工作降至最低。图17:自动化部署示意图1n 系统软件和业务软件自动安装部署能力支持系统软件和
45、业务的自动安装部署,包括部署设计、执行,软件源管理,镜像创建,镜像生命周期管理等。流程化的部署计划,支持部署模块和快速部署能力。在业务部署过程中,支持业务各网元亲和关系定义,避免将具有1+1、N+1等关系的网元部署在相同的物理设备上,进一步实现业务的高可靠部署。图18:自动化部署示意图2n 开放的接口和二次开发能力 云计算平台管理系统的自动部署功能提供开放的二次开发接口,业务系统可以基于该接口制作符合业务要求的软件源和安装脚本,实现业务自动部署。3、资源池高可用性n 虚拟机故障迁移当监控到某台虚拟机宕机时,自动将其迁移其它到其它物理机上重新拉起。n 物理机故障迁移 当整台物理机宕机时,自动将其
46、上所有虚拟机迁移到其它借用的物理主机上重新拉起。图19:资源池高可用性示意图n 灵活的备份恢复 云计算平台管理系统提供虚拟机备份策略的灵活定制功能,包括:a) 备份范围:全备份(VM完整备份)、增量备份(仅备份上次备份以来发生变化的数据)b) 备份周期:每天、每周、每月c) 备份保存时间可配置4、基于业务的只能管控能力和接口自动化的资源调度,实现资源的自组织、自管理,减少人工干预。通过采集业务运行数据,基于一定的分析模型和算法,建立业务运行特性模型,从多个维度对业务运行情况进行分析和监控。采集的数据同时作为后续业务调度基础,实现资源只能调度。资源池对业务开放标准的接口和能力,业务可以基于资源能
47、力定制业务管理和调度策略。5、高性能、高安全通过存储大内存Cache技术、高性能分布式存储算法、QoS保证等满足业务系统的高性能要求。通过网络隔离、系统加固、漏洞检测、数据加密、用户认证鉴权等满足业务系统的高安全性要求。1.3.1.2. 云资源服务门户 云资源服务门户Portal是一套向内部虚拟化系统的自动化管理系统,覆盖虚拟机部署、审批、运行、回收整个流程。提供了易于使用的Web界面可实现依照策略自动化部署虚拟机(VM),简化虚拟机请求和审批流程,跟踪和控制虚拟机,其运营流程如下图所示。图20:运营流程图其管理角色和功能应具备包括如下方面:1) 门户角色及功能简介 用户角色图21:CCP用户流程a) 登录Web页面,请求虚拟机(可批量)并确定请求状态。b) 查询所属的虚拟机,并进行基本控制(包括开机、关机、远程控制、监控性能等)。c) 提交虚拟机服务