管理高可用性精选文档.ppt

上传人:石*** 文档编号:44881263 上传时间:2022-09-22 格式:PPT 页数:17 大小:1.09MB
返回 下载 相关 举报
管理高可用性精选文档.ppt_第1页
第1页 / 共17页
管理高可用性精选文档.ppt_第2页
第2页 / 共17页
点击查看更多>>
资源描述

《管理高可用性精选文档.ppt》由会员分享,可在线阅读,更多相关《管理高可用性精选文档.ppt(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、管理高可用性管理高可用性2022/9/201本讲稿第一页,共十七页教学目标教学目标l理解系统可用性的概念理解系统可用性的概念l了解系统停机的主要原因了解系统停机的主要原因l掌握如何进行计算故障保护掌握如何进行计算故障保护l掌握如何进行数据故障保护掌握如何进行数据故障保护l掌握如何进行数据改变保护掌握如何进行数据改变保护l掌握如何进行系统改变保护掌握如何进行系统改变保护2022/9/202本讲稿第二页,共十七页教学难点和重点教学难点和重点l系统可用性的概念系统可用性的概念l系统停机的主要原因系统停机的主要原因l如何进行计算故障保护如何进行计算故障保护l如何进行数据故障保护如何进行数据故障保护l如

2、何进行数据改变保护如何进行数据改变保护l如何进行系统改变保护如何进行系统改变保护2022/9/203本讲稿第三页,共十七页教学过程教学过程17.1 概述概述 17.2 计算机故障保护计算机故障保护 17.3 防止数据故障防止数据故障 17.4 避免计划内停机避免计划内停机 2022/9/204本讲稿第四页,共十七页17.1 概述概述l可用性是一项度量计算机系统正常运行时间的指标。这可用性是一项度量计算机系统正常运行时间的指标。这项指标无论系统处于何种状态,例如系统维护或系统升项指标无论系统处于何种状态,例如系统维护或系统升级,都应该保证系统正常使用。可用性是解决应用程序级,都应该保证系统正常使

3、用。可用性是解决应用程序可以正常使用的时间的问题,可伸缩性描述应用程序可可以正常使用的时间的问题,可伸缩性描述应用程序可以接受的并发用户访问的数量问题。以接受的并发用户访问的数量问题。l在设计高度可用的在设计高度可用的IT网格基础架构时,所面临的一大网格基础架构时,所面临的一大挑战是检查和解决所有可能的停机原因。图挑战是检查和解决所有可能的停机原因。图17-1显示显示了一系列停机原因,这些原因可以归为两大类:意了一系列停机原因,这些原因可以归为两大类:意外停机和计划停机。外停机和计划停机。2022/9/205本讲稿第五页,共十七页17.2 计算机故障保护计算机故障保护 l当计算机系统或数据库服

4、务器意外故障并当计算机系统或数据库服务器意外故障并导致服务中断时,计算机就会发生故障,导致服务中断时,计算机就会发生故障,如图如图17-2所示。在大多数情况下,这是由所示。在大多数情况下,这是由于硬件故障。于硬件故障。l这些类型的故障可利用快速数据库故障恢这些类型的故障可利用快速数据库故障恢复和集群技术来解决。复和集群技术来解决。2022/9/206本讲稿第六页,共十七页带有真正应用集群的企业网格带有真正应用集群的企业网格 l真正应用集群真正应用集群(real application cluster,RAC)使得使得企业可以构建支持多个操作系统的服务器,并可提供出企业可以构建支持多个操作系统的

5、服务器,并可提供出色的可用性和可伸缩性。在真正应用集群环境中,色的可用性和可伸缩性。在真正应用集群环境中,Oracle可在一个集群中运行于两个或更多个系统之可在一个集群中运行于两个或更多个系统之上,并可以同时访问一个共享数据库。这使得一个上,并可以同时访问一个共享数据库。这使得一个数据库系统可以跨越多个硬件系统,同时对应用程数据库系统可以跨越多个硬件系统,同时对应用程序而言仍是一个统一的数据库系统,从而为用户的序而言仍是一个统一的数据库系统,从而为用户的应用程序带来出色的可用性和可伸缩性优势,包括:应用程序带来出色的可用性和可伸缩性优势,包括:容量规划的灵活性和经济高效性,进而使得企业可以随容

6、量规划的灵活性和经济高效性,进而使得企业可以随着业务的扩展根据需求进行扩展。着业务的扩展根据需求进行扩展。集群故障容错,特别是计算机故障。集群故障容错,特别是计算机故障。2022/9/207本讲稿第七页,共十七页绑定数据库崩溃恢复绑定数据库崩溃恢复 l造成意外停机的一个最常见的原因是系统故障或崩溃。系统故障是由造成意外停机的一个最常见的原因是系统故障或崩溃。系统故障是由于硬件故障、电源故障和操作系统或服务器崩溃造成的。这些故障导于硬件故障、电源故障和操作系统或服务器崩溃造成的。这些故障导致的中断次数取决于受影响的用户数量,以及服务恢复的速度。致的中断次数取决于受影响的用户数量,以及服务恢复的速

7、度。l高可用性系统设计用于在故障发生后,自动快速进行故障恢高可用性系统设计用于在故障发生后,自动快速进行故障恢复。关键系统的用户希望复。关键系统的用户希望IT部门能够承诺快速实现故障恢复,并部门能够承诺快速实现故障恢复,并可以预测故障时间。停机时间如果比承诺时间长,就会对运营造成直可以预测故障时间。停机时间如果比承诺时间长,就会对运营造成直接的影响,导致收入损失,生产效率降低。接的影响,导致收入损失,生产效率降低。lOracle数据库提供了非常快速的系统故障和崩溃恢复。数据库提供了非常快速的系统故障和崩溃恢复。2022/9/208本讲稿第八页,共十七页17.3 防止数据故障防止数据故障 l数据

8、故障是指丢失、损坏或破坏关键企业数据,如图数据故障是指丢失、损坏或破坏关键企业数据,如图17-3所示。数据故障的原因比计算机故障更加错综复杂,所示。数据故障的原因比计算机故障更加错综复杂,可能由于存储硬件、人为错误、损坏或站点故障而引可能由于存储硬件、人为错误、损坏或站点故障而引起。起。l非常重要的一点是,要设计一款解决方案来防止数据故非常重要的一点是,要设计一款解决方案来防止数据故障并提供故障恢复。系统或网络故障可能会妨碍用户访障并提供故障恢复。系统或网络故障可能会妨碍用户访问数据,但发生数据故障后,如果没有正确的备份或恢问数据,但发生数据故障后,如果没有正确的备份或恢复技术,则会导致需要数

9、小时的恢复时间,甚至丢失数复技术,则会导致需要数小时的恢复时间,甚至丢失数据。据。l在在Oracle Database10g中,极大地增强了数据保护能力。中,极大地增强了数据保护能力。2022/9/209本讲稿第九页,共十七页防止存储故障防止存储故障 l利用利用Oracle数据库的自动存储管理数据库的自动存储管理(ASM)特性。特性。ASM在在Oracle内核中提供了一个垂直集成的文件系统和数据卷管理器,大大减少了内核中提供了一个垂直集成的文件系统和数据卷管理器,大大减少了提供数据库存储的工作,提高了可用性,而无需购买、安装和维护专提供数据库存储的工作,提高了可用性,而无需购买、安装和维护专用

10、存储产品,并且为数据库应用提供了独有的能力。用存储产品,并且为数据库应用提供了独有的能力。ASM将其文件将其文件分布在所有可用存储器上,以实现最佳性能,而且它还可以镜像,防分布在所有可用存储器上,以实现最佳性能,而且它还可以镜像,防止数据丢失。止数据丢失。ASM扩展了扩展了SAME(全部条带化和镜像全部条带化和镜像)概念,并提概念,并提高了灵活性,从而可以在数据库文件级进行镜像,而无需在整修高了灵活性,从而可以在数据库文件级进行镜像,而无需在整修磁盘级进行镜像。磁盘级进行镜像。l更重要的是,更重要的是,ASM消除了与管理数据和磁盘相关的复杂性;它消除了与管理数据和磁盘相关的复杂性;它大大简化了

11、设置镜像、添加磁盘和拆卸磁盘的过程。大大简化了设置镜像、添加磁盘和拆卸磁盘的过程。2022/9/2010本讲稿第十页,共十七页防止人为错误防止人为错误 l几乎所有关于停机原因的研究都发现,人几乎所有关于停机原因的研究都发现,人为错误是导致停机的最大原因。人为错误为错误是导致停机的最大原因。人为错误包括:误删除重要数据;或包括:误删除重要数据;或update语句中语句中不正确的不正确的where子句更新了比预定更多的行。子句更新了比预定更多的行。要尽可能防止人为错误,当预防措施失败要尽可能防止人为错误,当预防措施失败后,需要撤消以前的操作。后,需要撤消以前的操作。lOracle数据库提供了易用且

12、强大的工具,数据库提供了易用且强大的工具,有助于管理员快速诊断发生的错误,并从有助于管理员快速诊断发生的错误,并从错误中得以恢复。错误中得以恢复。2022/9/2011本讲稿第十一页,共十七页 Oracle的闪回技术的闪回技术 l当授权用户犯错,需要使用工具来更正这些错误。当授权用户犯错,需要使用工具来更正这些错误。Oracle Database 10g提供了一系列人为错误更正技术,这些技术称为提供了一系列人为错误更正技术,这些技术称为闪回技术。闪回技术从根本上改变了数据恢复方式。闪回技术。闪回技术从根本上改变了数据恢复方式。l过去,数据库在几分钟内就可能损坏,但需要几小时才能恢复。利用过去,

13、数据库在几分钟内就可能损坏,但需要几小时才能恢复。利用闪回技术,更正错误的时间与错误发生时间几乎相同。而且它非常易闪回技术,更正错误的时间与错误发生时间几乎相同。而且它非常易用,使用一条短命令便可恢复整个数据库,而不必执行复杂的程序。用,使用一条短命令便可恢复整个数据库,而不必执行复杂的程序。闪回技术提供了一个闪回技术提供了一个SQL界面,能够快速分析和修复人为错误。界面,能够快速分析和修复人为错误。闪回技术为本地数据损坏提供了细粒度的外部分析和修复,如闪回技术为本地数据损坏提供了细粒度的外部分析和修复,如当错误删除客户订单时。闪回技术还支持修复更广泛的损坏,当错误删除客户订单时。闪回技术还支

14、持修复更广泛的损坏,同时快速避免长时间停机。同时快速避免长时间停机。2022/9/2012本讲稿第十二页,共十七页基于基于SQL的的Log Miner日志分析程序日志分析程序 lOracle日志文件包含有关日志文件包含有关Oracle数据库活动和历史的大数据库活动和历史的大量实用信息。日志文件包含执行数据库恢复所需的全部数量实用信息。日志文件包含执行数据库恢复所需的全部数据。它们还记录了数据库中的数据和元数据的所有变化。据。它们还记录了数据库中的数据和元数据的所有变化。lLog Miner是一个关系工具,支持使用是一个关系工具,支持使用SQL来阅读、来阅读、分析和翻译重做的日志文件。利用分析和

15、翻译重做的日志文件。利用Log Miner分析日分析日志文件,可以跟踪或审核数据变化、提供调整和容志文件,可以跟踪或审核数据变化、提供调整和容量规划的补充信息、检索复杂应用调试的关键信息,量规划的补充信息、检索复杂应用调试的关键信息,或恢复被删除的数据等或恢复被删除的数据等 2022/9/2013本讲稿第十三页,共十七页防止数据损坏防止数据损坏 l数据损坏通常由数据损坏通常由IO系列中的故障组件导致。例如,数据系列中的故障组件导致。例如,数据库将库将IO作为更新交易的结果。该数据库作为更新交易的结果。该数据库IO将在各个将在各个组件中进行传输,包括:操作系统的组件中进行传输,包括:操作系统的I

16、O代码、文件代码、文件系统、卷管理器、设备驱动程序、主机总线适配器、系统、卷管理器、设备驱动程序、主机总线适配器、存储控制器和磁盘驱动器,直至最后被写入。存储控制器和磁盘驱动器,直至最后被写入。IO堆堆栈中任何组件发生错误或硬件故障,都可能栈中任何组件发生错误或硬件故障,都可能“变换变换”数据中的一些位,进而导致错误数据被写入数据库中。数据中的一些位,进而导致错误数据被写入数据库中。这一损坏可能是数据库控制信息或用户数据,它们对这一损坏可能是数据库控制信息或用户数据,它们对于数据库的正常工作至关重要。同样,磁盘故障也可于数据库的正常工作至关重要。同样,磁盘故障也可能损坏数据库,而需要使用备份文

17、件来恢复数据库。能损坏数据库,而需要使用备份文件来恢复数据库。2022/9/2014本讲稿第十四页,共十七页17.4 避免计划内停机避免计划内停机 l计划内停机同样会对业务运营造成破坏,特别是对于需要支持多计划内停机同样会对业务运营造成破坏,特别是对于需要支持多个时区的用户的全球而言,情况尤为严重。在这种情况下,设计个时区的用户的全球而言,情况尤为严重。在这种情况下,设计一种可最大限度地减少中断的系统至关重要。计划内停机包括例一种可最大限度地减少中断的系统至关重要。计划内停机包括例行操作、定期维护和部署新设备等。行操作、定期维护和部署新设备等。l例行操作指频繁进行的维护任务,包括备份、性能管理

18、、用例行操作指频繁进行的维护任务,包括备份、性能管理、用户管理和批处理。定期维护,如安装补丁和重新配置系统,户管理和批处理。定期维护,如安装补丁和重新配置系统,只是偶尔进行,以更新数据库、应用程序、操作系统、中间只是偶尔进行,以更新数据库、应用程序、操作系统、中间件或网络。部署新设备包括硬件、操作系统、数据库、应用件或网络。部署新设备包括硬件、操作系统、数据库、应用程序、中间件或网络的重大升级。在这里,不仅需要考虑升程序、中间件或网络的重大升级。在这里,不仅需要考虑升级所需的时间,同时还需要考虑变化可能对整体应用产生的级所需的时间,同时还需要考虑变化可能对整体应用产生的影响。影响。2022/9/2015本讲稿第十五页,共十七页避免数据改变导致的停机避免数据改变导致的停机 2022/9/2016本讲稿第十六页,共十七页避免系统改变导致的停机避免系统改变导致的停机 l系统改变也是影响系统可用性的一个重要系统改变也是影响系统可用性的一个重要原因,如图原因,如图17-6所示。所示。l避免系统变化导致的停机的方法包括滚动避免系统变化导致的停机的方法包括滚动补丁更新、滚动版本升级等。补丁更新、滚动版本升级等。2022/9/2017本讲稿第十七页,共十七页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁