《XX公司CommVault灾难备份系统方案建议书(共56页).doc》由会员分享,可在线阅读,更多相关《XX公司CommVault灾难备份系统方案建议书(共56页).doc(56页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上XXX公司CommVault灾备方案建议书二二二年五月目 录第 1 章 前言1.1 概述承蒙XX公司对慷孚系统公司(CommVault)公司的信任和厚爱,提供我们参与其备份容灾系统建设的机会,我们不胜感激及深表荣幸。CommVault公司将本着诚挚、科学的态度,充分考虑贵方的需求,利用我们国际领先的科技和丰富的设计、项目经验,提供最佳的专业服务,以及高性价比的系统设计方案,提供一套优质的数据容灾备份方案。慷孚系统公司CommVault Systems于1996年从AT&T贝尔实验室分立出来发展成独立的软件公司,致力于数据管理方案的创新。CommVault SIMPAN
2、A平台提供统一的数据管理产品,已被全球众多2000强企业采用。1.2 容灾的必要性随着信息技术的发展,企业和政府部门越来越依赖于电子数据处理来进行它的商业行为和管理,电子数据处理的高可靠性和高可用性越来越成为关键。如果数据丢失,业务的开展将变得极其困难,更为重要的是,核心数据的丢失,严重时完全有可能造成整个系统的瘫痪。如果政府部门核心数据丢失,严重时会引起政治事件。因此,在限定的时间内成功的灾难恢复将应该是一个战略计划中的一个关键组成部分。 尽管随着科学技术的发展,计算机系统的可靠性日益增加,但是人为的操作错误、软件缺陷、硬件故障、电脑病毒、骇客攻击、自然灾难等诸多因素,均有可能造成数据的丢失
3、,依然可以轻而易举地摧毁企业赖以生存的IT系统,从而造成无法估量的损失。所以,建立灾备中心便成了必然的选择。1.3 容灾规划与技术路线我们常常看到这样一个现象,一旦某单位要建容灾系统,众多硬件、软件厂商都到场,纷纷推荐各自的灾备或容灾解决方案,结果是产品和概念的混战。那如何正确认识灾难备份呢?比较简单的方法就是先从国家标准开始解读。1.3.1 解读国家标准国家标准信息系统灾难恢复规范GB/T20988-2007有关灾难备份的基本概念定义如下:灾难:由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件,通常导致信息系统需要切
4、换到灾难备份中心运行。灾难恢复:为了将信息系统从灾难造成的故障瘫痪状态恢复到正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。灾难备份:为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、专业技术支持能力和运行管理能力进行备份的过程。灾难备份系统:用于灾难恢复目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统。国标中清晰的定义了信息系统“灾难”的概念,一旦信息系统出现了灾难,就要进行“灾难恢复”,为了能进行“灾难恢复”,就必须提前进行“灾难备份”,于是就要建“灾难备份系统”,灾难备份系统由三个子系统构成:数据备份系统、备用数据处
5、理系统和备用网络系统。通过以上的分析,我们就能了解容灾是个系统工程,是对数据、数据处理系统、网络系统、基础设施、专业技术支持能力和运行管理能力进行备份的过程,当灾难发生后,能按设计要求进行灾难恢复。我们需要建立灾难备份系统来实现灾难备份,由于备用数据处理系统和备用的网络系统只要购买并安装实施所需的硬件设备就能达到目的,相对比较简单,最为复杂的是如何建立满足灾难恢复要求的数据备份系统。1.3.2 灾难备份的分级标准国家标准信息系统灾难恢复规范GB/T20988-2007中规定了灾难备份分级标准,对灾难备份的级别有比较详细的描述,对我们在规划实施灾难备份系统时有很好的指导意义。下面的表格中描述了灾
6、难备份的分级标准。全备份介质保管复制备用场地及设备恢复时间数据丢失一级每周场外存放无满足介质存放2天1-7天二级每周场外存放无具有或能调配部分设备1天1-7天三级每天场外存放定时具有部分设备12小时24小时四级每天场外存放定时具有全部设备2天几分钟2天30分钟六级每天场外存放零丢失与生产系统相一致,并能无缝却换几分钟0从这个分级标准中,我们看到以下几个要点:1. 每个级别的备份频率不一样,但备份数据必须要场外存放。2. 不同级别采用的数据备份方式不同,一、二级不需要数据复制,三、四级采用定时复制,五级采用实时复制,六级要求不能丢失数据,并能进行无缝切换。3. 每个级别的RPO/RTO也有所不同
7、。在我们实际的应用环境中,并不是一个数据中心的所有系统都采用同一种容灾级别,我们对重要的系统采用较高的级别,而相对不重要的系统采用较低的级别。1.3.3 数据复制不等于容灾数据备份系统主要是对数据进行保护,目前,不同的IT厂家都有各自不同的数据保护方案,有的是硬件产品,有的是软件产品,虽然各个厂家的产品名称都不一样,但数据保护的算法都大同小异。现在企业很多已经采用RAID技术对重要数据进行保护,利用内置的RAID卡或者外置的磁盘阵列,采用Raid1、5等技术防范硬盘坏而导致数据丢失。除此之外,数据保护的算法还有:复制、快照和备份恢复,下面我们对IT业界这几种最流行的数据保护算法的特点进行对比分
8、析。RAID复制快照备份物理错误(47%)自然灾害YESYES硬件失效YESYESYESYES逻辑错误(53%)人工出错YESYES软件失效YESYES病毒YESYES恢复点(RPO)能容忍丢失多少数据?没丢失秒、分钟、小时小时天恢复时间(RTO)要多久才能恢复实时分钟、小时分钟小时天数据保留时间能恢复多长时间内丢失的数据不能不能几小时几天几周几月几年从上面这个对比分析表中我们可以得出以下结论:数据备份系统主要有5个目标:防止物理错误、防止逻辑错误、满足RPO、满足RTO、满足数据保留的时间,没有一种单一的数据保护算法能同时完全满足这5个目标。因此一个完整的数据保护方案应该是这几种算法结合而构
9、成,这样我们在规划设计灾难备份系统时,也应该采用综合的解决方案。1.3.4 灾备级别与投资关系下图是RPO与投资的关系曲线,当灾备级别越高,RPO就越小,系统的投入就越高,投资是一个几何曲线,因此,我们必须根据我们实际应用的需要,选择恰当的灾难备份级别,避免为了防范一个小概率的灾难事件,而要投入太高建设费和运维费用。很多用户就因为费用的原因而放弃了灾难备份。从国标的要求我们也可以看到,并不是所有的容灾级别都需要那么高的RPO,我们应该根据业务系统的要求来选择合理的容灾级别。灾难保护计划的目的是,确保关键业务持续运行以及减少非计划宕机时间。所有与容灾方案相关的计划都试图在方案本身、宕机时间和成本
10、之间寻找一个平衡。合适的就是最好的,切忌贪大求全。比如有些业务可以容忍一段时间的停机,完全可以通过脱机备份方式进行恢复,就没有必要建设实时的容灾复制,否则,不仅浪费了大量的投资,而且也占用了大量的维护成本,使总体拥有成本(TCO)很高。同时,在人力紧缺的情况下,不能把有限的人力投入到业务容灾系统上去。综合以上所述,可以如下图所示: 1.3.5 不同数据保护方法与RPO和RTO的关系不同的数据保护方法有不同的RPO和RTO,但并不是RPO越小,RTO就越小,反过来也一样。有些系统要求RPO较小,主要要求数据丢失很少;有些系统要求RTO较小,主要是满足快速提供服务;有些系统要求RPO和RTO都要小
11、,既要少丢数据,也要快速恢复。当然天下没有免费的午餐,要求高,投入也会很高。下图是不同的数据保护方法与RPO和RTO的关系:复制方式,虽然丢失的数据比较少,但是恢复运行时间不一定就很短。由于数据库的日志机制,在不同的设置下,如果复制中断,灾备中心有可能需要比较长的修复时间(日志回滚和检测)。另一方面,由于复制不能避免逻辑错误,在发生逻辑事故时,复制两端的数据都被破坏,恢复运行就更困难。所以如果要快速恢复应用运行,一般需要和快照,备份结合,来提高灾备数据的可用性。快照方式,快照机制能够在灾备中心创建若干个恢复时间点,例如1个小时做1个快照,保留4个快照点。快照丢失的数据有可能比较多,一般是1个小
12、时,但是恢复的速度非常快。如果和应用快照结合的话,恢复数据库运行一般只要几分钟,因为修复的时间非常短。与数据库结合的快照在某个时间点能够确保数据库数据完整一致。备份方式,可以利用磁带或磁带进行备份。传统上采用备份方式的RPO和RTO是最差的。但是,由于可以采用事先在灾备中心恢复数据,这样就能大大改善RTO,当然采用磁盘备份的效率会更高。1.3.6 不要掉入RPO陷阱谁都希望数据丢失得尽量少,希望RPO越小越好,那投入的建设费和运维费是相当惊人的!但实际上并不是所有的系统都有那么高的RPO要求,很多业务系统丢失5分钟的数据和丢失一小时的数据的区别不大,这时因为一旦数据丢失以后,都需要业务部门来反
13、复核对业务数据,为了保险,通常要求把系统回退到某个整时间点,再重新输入业务数据,然后再起用系统。对于一个远程的灾备系统,当起用远程的备用系统时,需要特别的管理流程或审批流程,通常不建议采用自动切换方式,否则造成的混乱和损失会更大!通过解读国标,不同级别的容灾,RPO、RTO是不同的,根据自己业务的要求,合理选择RPO和RTO,是容灾建设的第一步。1.4 容灾恢复计划及演练很多企业建设容灾系统,重视硬件系统的投资,那是看得见的“实实在在”的容灾系统,而轻视在容灾恢复计划(DRP)的“软件”投入,其实这是非常严重的误区。容灾系统的建设是需要同时满足RTO和RPO指标的,恢复时间对我们及用户来说是至
14、关重要的,试想,如果没有一套行之有效的DRP,在灾难发生时,即使 “硬件”是运行正常的,(如果没有经常的测试来验证,又如何能保证是正常的?)谁来组织进行容灾恢复?人员如何分工?根据什么来进行恢复?我想,忙中生乱,可能会产生更大的乱子。因此,必须为灾难备份系统建立一套灾难恢复计划,包括建立灾难备份系统的管理机制和组织架构、灾难响应流程、灾难切换流程、灾难应急流程等。灾难恢复计划必须定期的进行演练,演练不但是为了熟悉容灾切换、回切流程,使企业内部各部门及人员熟悉自己在容灾中所扮演的角色,做到胸有成竹,才能够在灾难真正发生的时刻有条不紊地开展恢复的过程,而且可以提高人们的安全意识,在平时维护、软件升
15、级时注意容灾系统的维护。通过演练,还可以发现切换、回切流程的不足,验证和优化灾难恢复计划,确保在灾难发生时,灾难恢复计划能够行之有效的。演练的过程可以分为“纸上谈兵”和实地演习两种方式,根据企业需要及对业务影响的不同分别采用。需要注意的是,无论平时的测试如何完善,也没有办法预测可能发生的灾难情况。关键人员的损失或者关键文档的丢失,都有可能对灾难恢复计划的执行造成巨大影响。因此,在灾难演练过程中要注意到人员的交叉备份情况,除了每个人自己所担负的责任外,尽量做到关键步骤有后备人选作为应变。第 2 章 用户现状和需求分析2.1 用户现状我们把XX公司的IT工作场所划分成两类:l 生产数据中心生产数据
16、中心是服务器、存储设备、网络设备最集中的工作场所,也是数据最重要、最集中的地方,是重点保护对象。l 容灾数据中心容灾数据中心是数据中心的备份场所,万一当灾难发生时,容灾数据中心能顶替数据中心进行工作,建立一个完备的容灾数据中心是非常必要的。随着IT的发展及计算机应用的普及,办公应用中越来越多运用计算机,大部分的工作数据都会存储在个人的电脑上或服务器上。经常会碰到由于死机或蓝屏、系统和应用程序不稳定、硬盘故障等而导致数据丢失的问题,电脑故障并不可怕,电脑数据丢失可能会导致几天、几个月甚至几年的工作付之东流。协同办公系统建设及推广,使日常帮越来越依赖于协同办公系统,办公系统的正常直接影响到日常办公
17、系统的正常进行。公司的生产系统更重要,一旦出问题,必将影公司的正常生产和公共形象。2.2 目标需求分析我们首先为不同的应用系统确定不同的备份级别:系统名称备份方式复制容灾设备恢复时间数据丢失对应国标级别生产数据库每周全备每天增备实时备份服务器 30分钟5分钟5级生产应用每周全备每天增备定时备份服务器 30分钟1天4级OA数据库每周全备每天增备实时备份服务器 30分钟5分钟5级OA应用每周全备每天增备定时备份服务器 30分钟1天4级财务系统每周全备每天增备无异地保留备份数据12小时1天3级档案系统每周全备每天增备无异地保留备份数据12小时1天3级工作日志每周全备每天增备无异地保留备份数据12小时
18、1天3级全文检索每周全备每天增备无异地保留备份数据12小时1天3级公文交换每周全备每天增备无异地保留备份数据12小时1天3级台式机每天增备无异地保留备份数据12小时4小时3级除上述灾备要求外,在技术和管理方面还有以下问题需要注意:l 项目实施的风险:由于现有的系统都是正在运行的关键系统,一定要注意项目实施的风险,最好不要对现有系统存储或数据库进行较大的改变,最好不要重新安装系统和数据库。l 管理权限问题:对系统备份管理权限管理必须合理,如备份和恢复权限应该分开,避免错误恢复而导致系统破坏。l 统一监控问题:在数据中心能对系统的运维状况进行监控管理,及时发现问题,并能进行事后审计监督和优化改进。
19、l 容灾演练:容灾演练是灾难恢复的重要环节,因此要求能方便进行容灾演练。l 投资保护问题:尽量要利用现有的主机和存储设备,而不是重新购买新主机或存储设备。第 3 章 灾备方案规划3.1 灾备拓扑架构数据中心和容灾中心直接有专用的网络链路连接,整个系统构成说明如下:l 备份管理服务器:配置、管理、监控整个灾备系统。l DR备份管理服务器:备份管理服务器的容灾备机,当备份管理服务器出现灾难时,由该机来接管。l 台式机备份服务器:对台式机进行备份。l 备份磁盘:磁盘备份设备,存放备份数据。l 容灾备份磁盘:存放容灾备份副本的磁盘设备。3.2 对服务器的备份保护根据上一节的需求分析,我们对数据中心的服
20、务器都要进行数据备份保护。我们采用LAN和LAN FREE备份模式,每天对生产服务器进行备份,备份策略为:每周末进行全备份,每天进行增量备份,备份数据先保留在数据中心的备份磁盘上,然后再把备份数据复制到容灾中心的容灾备份磁盘上。这样就实现了所有服务器数据的容灾备份,能满足国标3级要求。在LAN备份模式下,在生产机内只需要安装备份iDA模块。在备份操作时,iDA模块把需要备份的数据从生产数据存储设备中读入生产机,并通过LAN把备份数据传给专用MA服务器,MA服务器将把数据通过SAN写到备份设备上;在恢复操作时,MA服务器将通过SAN网从备份设备上读入恢复数据,并通过LAN把数据传给iDA,iDA
21、把数据写入生产系统。在LAN模式下,备份/恢复操作的数据需要经过LAN网转送。LAN-Free的备份方式是建立在SAN(存储区域网)的基础上的,基于SAN的备份是一种彻底解决传统备份方式需要占用LAN带宽问题的解决方案。它采用一种全新的体系结构,将磁带库和磁盘阵列各自作为独立的光纤结点,多台主机共享磁带库备份时,数据流不再经过网络而直接从磁盘阵列传到磁带库内,是一种无需占用网络带宽 (LAN-Free) 的解决方案。LAN-Free的优点是数据备份统一管理、备份速度快、网络传输压力小、磁带库资源共享;缺点是投资高。在LAN-Free该模式下,在生产机内需要安装iDA和SAN MA模块。在备份操
22、作时,iDA模块把需要备份的数据从生产数据存储设备中读入生产机,并在生产机内把备份数据传给SAN MA模块,SAN MA模块将把数据通过SAN写到备份设备上;在恢复操作时,SAN MA将通过SAN网从备份设备上读入恢复数据,在生产机内把数据传给iDA,iDA把数据写入生产系统。在LAN Free模式下,备份/恢复操作的数据经过SAN网转送。数据备份采用D2D2T方式,D2D2T的意思是磁盘到磁盘到磁带备份模式,这是一个经济、高效、可靠的备份方法。D2D2T技术针对当前的纯磁带库方案,有更快的吞吐率,它不仅仅是把数据拷贝到磁盘上或磁带就完事,而是针对数据有一整套的管理,它不仅仅能提高效率,而是能
23、确保关键的信息在生命周期的每个环节都是可用的、安全的。利用高品质的廉价磁盘(阵列)和D2D技术来建第二级存储,与磁带相比具有下列优势:1. 快速的备份和恢复数据。2. 磁盘操作比磁带快,特别在装载和查找时。3. 烦恼的磁带故障被消除。4. 磁盘具有随机读写和优化查找的功能,而磁带是个顺序设备,对随机读写文件很慢。5. 磁盘能支持多台主机同时并行存取。6. 磁盘的存储方案比磁带方案占用更少的机房面积。7. 利用磁盘存储方案可消除操作磁带时的人为错误。(备份数据的复制可采用SDR或Auxcopy, 根据情况而定)当数据备份到磁盘后,利用辅助拷贝功能,可以在系统闲暇的时候通过网络把备份数据传送到容灾
24、中心的存储设备上,这样在主拷贝丢失或者损害的时候不会影响数据的恢复,对数据提供了最大的保护.辅助拷贝可以同通常的备份策略一样定期进行,也可以在备份完成后自动触发。用辅助拷贝功能,CommVault软件能在不同的介质和地方之间创建或迁移备份数据的拷贝。这种“分级存储”是完全基于策略的,在系统的后台进行,不需要用户干预。数据拷贝的创建是基于策略的设定,而数据的保留和裁减是基于保留策略。因此,当存储方式过去了需要改变时,数据的拷贝能在整个存储集合上被终止或被再创建。3.3 对台式机的集中备份保护我们对台式机提供集中数据保护,对台式机采用永远增量的定时复制方式把台式机变化的数据传送到台式机备份服务器,
25、在备份服务器上,能对这些数据每天进行集中备份,备份副本保留在备份磁盘设备上,然后再把备份副本复制一份到容灾中心,这样就完成了台式机数据的集中灾备。当某个用户丢失了台式机上的数据,能直接访问备份数据,并能进行快速恢复。这样就实现了所有台式机数据的容灾备份,能满足国标3级要求。(备份数据的复制可采用SDR或Auxcopy, 根据情况而定)3.4 对关键服务器复制保护生产服务器和OA应用对RPO、RTO的要求比较高,希望数据丢失尽可能少,恢复尽可能快。可是,要实现这一愿望,我们采用实时复制的技术来对他们进行保护,实时把变化的数据复制到备用服务器上,我们建议备份服务器最好部署在容灾中心,这样就能到达国
26、标第5级的容灾标准。3.4.1 复制方案原理CommVault的CDR连续数据复制是一个性价比很高的解决方案,工作原理如下图所示:CommVault的CDR是对系统中变化的数据进行复制,因此效率高,同时,CDR能确保文件系统以及Oracle数据库的数据进行复制,并能在目标端对容灾数据进行快照保护,确保数据的一致性。3.4.2 容灾各阶段的操作整个容灾系统共分5个阶段:l 初始化阶段:通过网络在容灾中心生成初始化数据库。l 容灾复制阶段:1. 通过CDR复制变化的数据2. 定时(如2小时)对容灾数据库库进行快照保护3. 每天做本地数据库的热备份l 应急启动阶段:如果生产系统崩溃,只要将容灾数据库
27、启动即可,能够确保快速正确的启动l 容灾验证和演练阶段:方式一:直接验证容灾数据库1. 在验证前,对容灾数据库进行快照保护2. 直接启动容灾数据库进行验证方式二:利用数据库快照进行验证1. 装载早先的数据库快照,再启动容灾数据库,实现验证和演练2. Shutdown演练数据库,并且删除验证快照l 灾难恢复阶段:1. 容灾数据库数据崩溃,相当于重作1次初始化2. 生产数据库数据崩溃,可以反向初始化,从而重建生产数据库。3.4.3 复制方案的特点l 一体化的保护方式,方案包括:备份,复制,快照。能够避免用户生产系统的物理和逻辑故障。l 无需修改用户现有的存储方式和数据结构,减少实施风险。l 用一个
28、图形化界面统一管理整个应急流程,并且有图形化的报表,报警,监控等功能;方便用户的管理和运维。l 复制的时候支持网络流量的控制和操作时间窗口,能够适应窄带宽和广域网的环境。l 由于是基于OS的复制和数据库无关,不会由于意外原因干扰生产数据库的使用。l 方便实现应急系统的演练,验证和重建,而且这些操作也不会干扰生产系统的运行。l 由于能保证容灾系统上的数据一致性,所以RTO时间很短。l 容灾系统上还保留多个时间点的快照,从而可以快速回退到前一个时间点的状态。l 同时容灾系统上还保留一段时间内的归档日志,所以用户可以回退到故障发生的任意时间点。减少发生故障造成的数据丢失量。3.4.4 与其它方案的对
29、比l 与数据库复制软件的比较数据库复制软件(如DG、GSJ)的主要不足之处:1. 无法避免逻辑错误;2. 初始化和灾难重建时候,需要和第三方备份恢复软件配合;3. 没有完善的监控机制和报表机制,需要大量的人工干预;4. 没有针对网络流量的控制机制和操作时间窗口,在灾带宽和广域网上容易引起故障;5. 数据库复制软件的复制机制是基于数据库内部的,有可能由于其他故障(网络,应急主机等)干扰生产数据库系统的运行;6. 容灾测试比较复制。l 与硬件或卷复制的比较硬件复制或卷复制的主要不足之处:1. 硬件复制或卷复制的投资成本很高;2. 硬件复制无法避免逻辑错误,如果需要避免逻辑错误,必须采用快照,这样所
30、需要额外的投资;3. 可能需要更改生产系统的存储体系和数据结构,实施复杂,实施风险比较高;4. 扩展升级不灵活,上了这个平台就无法更改;5. 没有针对网络流量的控制机制和操作时间窗口,在窄带宽和广域网上容易引起故障;6. 应急系统是非活动状态,无法确保RTO的时间;7. 容灾测试比较复制。l 与传统备份恢复的比较传统备份软件的主要不足之处:1. 备份恢复的RPO级别太差,往往丢失的数据是一天的;2. ROT时间太长,恢复操作需要较长时间;3. 恢复演练期间,需要大量的人工干预,管理维护复杂;4. 由于需要定期传送全备份,仍然需要大量的网络传送数据,不适合窄带宽和广域网。3.5 方案的整体优势C
31、ommVault的容灾解决方案是一个一体化的解决方案,集多种先进的技术如一体,具有以下优势:1. 方案完全能满足国标要求省级数据中心容灾级别能满足国标3,4,5级。2. 方案的技术优势CommVault的解决方案集多种先进的技术如一体,主要的优势有:l 完全一体化的解决方案,方案包含连续复制、定时复制、快照管理、备份管理、重复数据删除,能提供全面的数据保护;l 先进的传输技术,能进行压缩、加密以及重复数据删除,充分利用WAN有限的带宽并确保数据安全,容错能力强,并具有带宽控制、处理网络中断、带外同步等企业功能;l 支持异构环境,支持多平台并能确保Oracle数据库的一致性,与存储硬件平台无关,
32、方案具有很好扩展性。3. 运维管理的优势CommVault的方案具有灵活的管理策略,能进行集中于分散相结合的管理,能为每个管理员设定恰当的权限,能进行集中监控和审计。运维的专家组成员能方便的进行远程技术支援,验证和灾难恢复都十分方便。4. 方案实施容易风险小方案实施很容易,不需要改变现有的生产系统环境,不需要变更存储设备,也不需要重装生产系统和数据库,只要在生产计上安装CommVault复制代理插件就行。5. 能极大节约整体成本由于CommVault的方案只要需要增添部分容灾设备,而不需要在生产系统上增添新的设备,能极大节约硬件投资。由于管理方便、灵活,也能节省大量运营成本。第 4 章 Com
33、mVault连续复制技术介绍分散型的企业和政府部分,在不同的地方都有办公室和数据中心,他们非常关注怎样用SIMPANA来保护大量的分散数据。对这些分散的数据中心,传统的方法是依靠在本地放置备份设备,进行本地备份,结果是费用昂贵,不能实现容灾备份,由于操作人员的技术水平差异,对异地数据的保护和恢复的问题不少。CommVault已经攻克这一问题,SIMPANA有许多选项来确保分散型企业实施高性价比、高质量的异地数据保护和可用性方案,构成一个统一的企业级数据管理环境。连续数据复制CDR(Continuous Data Replicator)是CommVault组件中的一部分,能和其他模块一起共同进行
34、数据保护,CDR和快照管理技术都处在数据中心的恢复管理层。CDR采用了独特的方法,来满足用户的RTO和RPO。由于变化是连续复制的,在大多数情况下,复制目标端的数据恢复点仅比原始数据晚几秒钟。通过与复制时的恢复点相结合,恢复时间将被减到最小,可以从复制卷上恢复,也可从多个具有时间点的有效快照中选一个进行恢复。CDR与CommVault全面数据管理组件相结合,利用同一个界面和策略,提供独特的复制数据管理,来贯穿数据生命周期的管理。4.1 恢复管理层在企业环境中脱颖而出恢复管理层与数据保护层的区别在怎样才能快速恢复数据,使恢复时间(RTO)以及丢失的数据(RPO)都能满足用户的要求。像备份这种典型
35、的数据保护是以天来计算这些值,而恢复管理层中的产品是利用复制、快照技术来保护数据,采用数据本来的格式,恢复操作采用卷装载或复制回去的方法,不像传统的备份需要从磁盘或磁带中恢复数据。CDR采用了独特的方法,把基于文件的复制和快照结合起来,来满足用户的RTO和RPO。由于文件的变化是被连续复制的,在大多数情况下,复制目标端的数据恢复点仅比原始数据晚几秒钟。通过与复制时的恢复点相结合,恢复时间将被减到最小,可以从复制卷上恢复,也可从多个具有时间点的有效快照中选一个进行恢复。4.2 CDR在恢复层中适合做什么CDR独特功能:把具有字节级别变化的数据进行复制,并和数据快照保护相结合,为基于WAN的环境创
36、建了一个理想的方案:n 拥有许多远程办公室或多数据中心的用户在寻找稳固的、集中数据保护策略来保护分散在各地的数据,CDR字节级别的复制功能可以优化WAN网有效带宽,并与Galaxy备份透明相结合,为远程办公司和多数据中心提供了全面的数据保护方案。n 用户在为关键企业应用数据寻找具有性价比的容灾(DR)方案,比喻,他们希望保护邮件系统和数据库的数据。通过把复制技术和具有应用感知能力的快照技术相结合,CDR能自动维护在异地的远程副本更新,万一出现数据损坏或灾难,这些远程副本能被快速的装载并投入使用。4.3 CDR怎么工作的CDR以近似实时的方式把数据从源计算机复制到目的计算机,来保护应用数据和文件
37、系统。在异地的关键数据能被定义成复制集合中的一个成员,跨过WAN网指向数据中心的目标文件,CDR也能以成本低的复制提供数据可用性服务。当在源计算机写入数据时,复制的数据被获取,字节级别的变化都被传送到目的计算机,在目的计算机上被再次写入。复制过程分两个阶段来传送数据,开始时创建一个基本的复制或叫镜像,接下来对数据集合中的数据进行连续的、增量数据更新。一个记录机制被用来确保把增量变化数据传送到目标的可靠性,在工作时间,网络带宽控制也被用来限制源计算机传送数据的流量。根据数据的类型、数据集合的大小和数据的变化率,复制方法能够提供更有效、性价比更高的选择来保护异地的数据资源。SIMPANA的CDR相
38、对市场上的单一复制产品有更丰富的整体数据保护,不像竞争对手的产品,先在源计算机上创建一个快照,再把快照复制到目标,这样潜在的大量映像数据要通过网络。CDR能调用已复制的数据来提供确保应用一致性的快照,这些恢复点存在目标计算机上,能作为DR备份的数据源,把复制配置和中心备份策略直接透明地集成在一起。下图表示了复制的过程和恢复点的创建。4.4 复制模式CommVault CDR支持如下的复制模式:1对1的复制多对1的复制1对多的复制4.5 远程办公室和多中心的数据保护CDR能完全与SIMPANA的数据生命周期管理功能紧密结合,提供了强大的统一界面,不仅控制复制过程,还能对数据保护、归档远程办公室的
39、数据过程进行控制。这样,管理员就能用一个策略和一个控制台无缝地把数据生命周期管理拓展到远程办公司。下图通过一个案例来说明,由多个远程文件系统、邮件系统和数据库系统的办公室,还有一些本地的服务器,是怎样来进行集中数据保护的。应用数据被复制到中心的一个服务器上,在这台机器上创建一个备份策略来提供离线数据备份,这个备份集合能够直接浏览,如果在客户端安装备份代理,也能直接恢复到客户端。这就大大地减少了管理员跟踪备份集合的负担,特别是对远程服务器。数据一旦复制,当恢复点被创建,远程办公室的数据马上就成了数据保护策略的一部分,恢复点是以COW来存在的,COW是一个比较省空间的快照卷,包含了被复制的数据。这
40、种快照能以多种方式来恢复数据:n 快照能以只读卷被装载,供用户来浏览和读取复制文件数据;n 管理员能对COW上的任意一个恢复点进行处理,把它创建成一个完整的卷,该卷对网络环境中的任何服务器具有指定的时间点。n 当恢复点被创建,它能与一个存储策略相关联,自动创建备份集合,该备份集合能浏览和恢复,就像普通的恢复过程的一部分。这种把复制和备份相结合的独特功能,也能让用户在远程办公室浏览和恢复他们的备份集合,只要他们在本地也创建备份集合,CDR能自动维护把复制数据映射到备份主机上。4.6 高性价比的容灾恢复CDR目前能支持的环境有:Windows、Unix和Linux文件系统以及Exchange、SQ
41、L合Oracle应用。因为CDR能复制并管理应用一致性的时间点,当在数据中心需要实施容灾策略时,CDR能提供高性价比的选择,来完成与SRDF一样的远程镜像方案。CDR自动发现安装的应用和需要复制的相关文件夹(log、database等),当应用程序在线时,也能创建对这些关键数据的初始复制,CDR能处理锁定的文件。灵活的CDR配置选项能设定1对多工作模式,把一个关键数据库从中心复制到多个DR场所。恢复点能按一个特殊的或按计划的方式来创建,能使关键应用在DR场所能快速和可靠的启动。下图显示了一个可能的配置,中心的邮件服务器和数据库服务器通过WAN网被复制到两个不同的地方,来防止灾难出现。应用数据被
42、复制到远程中心,恢复点在指定的间隔被创建,确保在灾难出现时有一个有效的快照。4.7 处理网络中断的方法远程复制方案的可靠性通常任由不确定的网络摆布,网络中断正在发生或将要发生,从中断网络中恢复的能力是所有灾难恢复方案生成的关键,CDR具有从中断网络中快速可靠恢复的独特能力,确保数据集合能有效地同步。考利到网络中断在复制中的影响,有两个情况需要考虑:小的网络中断:一次小的网络中断可能在几分钟到几小时恢复。依据中断期间持续时间和复制数据的数量,复制系统能容易的在源计算机上继续获得文件的变化存入复制日志中,当网络连接恢复后,把复制日志传送到目标计算机上。就像大多数复制方案一样,CDR在网络中断期间,
43、继续在源计算机上记录变化的内容到日志上,在目标计算机上,继续回放复制日志,把复制数据写到系统,正常的复制和应用活跃状态都没中断。大的网络中断:一次大的中断是持续的时间足够长,以致在源计算机上获得的复制变化量超过了有效日志空间,当这种情况出现,在网络中断期间的复制变化数据和目标机上的完整性都丢失了。一种方法是在目标计算机上重建复制,把源计算机上的所有数据都传送到目标计算机上重新初始化复制。对大型数据库,这种方法是要禁止的,正因为这样,有些复制方案采用在源和目的之间逐个文件比较的方法来进行初始化,虽然这种方法消除了复制所有的文件,对一个较大的复制集合,这也会耗费资源而增加时间。CDR在链路恢复后有
44、智能的同步机制来自动重建复制的完整性,不需要把全部的文件复制一次,也不要忍受逐个文件比较的过程。CDR采用了革新的机制,直接调用Windows文件系统的变化日志文件,能迅速确定哪个文件在网络中断期间被修改了,不需要花时间来逐个比较,对一个企业级的数据库来说,这点非常重要。4.8 最大限度利用有效网络带宽CDR提供许多企业级别的功能来利用有效的网络资源,不论是对连接远程办公室的企业专用网还是公共的因特网,CDR允许管理员进行控制并在传输数据时保护数据。数据压缩:当网络带宽很宝贵时,管理员可选择压缩复制数据流,当在源计算机上设置压缩选项,所有在复制日志中的数据,在传送到目标计算机之前都会被压缩,在
45、目标计算机上,数据会被解压缩然后再写入目标卷。压缩的有效空间高度取决于被复制的数据类型。数据加密:当在远程办公司之间复制关键业务数据时,专用网络并不是很有效或很合算,当在开放的网上复制数据时,为了保护数据的私密性,管理员可选择加密选项,CDR将在源计算机上采用Blowfish加密算法来加密复制流,当到达目标后,复制流会被解密再写入复制卷。 带宽限制:网络资源是很昂贵的,一个专用网很少只用来进行复制,在大多数操作环境里,网络用来复制的同时,还要用来处理一般的业务。重要的是,复制过程会与其他资源并存来争夺网络带宽。CDR提供了带宽限制功能,让管理员能明确的定义多少有效带宽能用于复制,另外,带宽的分
46、配能按管理员制定的计划来自动调整。例如,在典型的办公环境里,可在每个晚上和周末选90%的带宽来复制,在上班时选40%的带宽来复制。脱离捆绑的同步:在很多情况下这是一个共同的问题,整个数据集合相对每天的变化确实太大,带宽能满足每天变化数据的复制,但创建初始复制时要花好几天才能完成。在这种环境下怎样才能快速的把初始数据复制到目标计算机上呢?可采用替代的方法:脱离捆绑的方式来完成。CDR提供一个工具能处理大容量的复制集合,这个工具与复制过程相结合,获取初始复制的状态,管理员可用其他替代的方式把大量的初始数据集合传送到目标主机上。这些替代的方法可以用备份集合或磁盘克隆,然后再运送到远程。当数据运送时,CDR就获取并记录源计算机上的数据变化,当初始化完成