《第七讲-系统配置与性能评价(共3页).doc》由会员分享,可在线阅读,更多相关《第七讲-系统配置与性能评价(共3页).doc(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上第七讲 系统配置与性能评价系统可靠性:系统的故障模型、可靠性模型和组合模型等计算;计算公式、概念和评价标准性能评价方法软件容错系统可靠性的基本概念可靠度:系统的可靠度R(t)是指在t=0时系统正常的条件下,系统在时间区间0,t内能正常运行的概率。可用度:系统的可靠度A(t)是指系统在时刻t可运行的概率。可维度:系统的可维度M(t)是指系统失效后,在时间间隔t内可被修复的概率。平均无故障时间(MTTF):可靠度为R(t)的系统的平均无故障时间(MTTF)定义为从t=0时到故障发生时系统的持续运行时间的期望值,则如果,则MTTF=1/;为失效率,是指器件或系统在单位时间内
2、发生失效的预期次数,假设为常数。平均故障修复时间(MTTR):可用度为A(t)的系统的平均故障修复时间(MTTR)设A1(t)是在风险函数Z(t)=0且系统初始状态为1状态的条件下A(t)的特殊情况,则。设修复率(t)= ,是指单位时间内可修复系统的平均次数,则MTTR=1/。平均故障间隔时间(MTBF):对于可靠度服从指数分布的系统,从任一时刻t0到达故障的期望时间都是相等的,有MTBF=MTTR+MTTF。系统的可靠性计算常见的系统可靠性数学模型有:串联系统:设系统各个子系统的可靠性分别为R1,R2,Rn,则系统的可靠性R=R1*R2*Rn;串联的子系统越多,系统的可靠性越低。如果系统的各
3、个子系统的失效率分别为1,2,n,则系统的失效率=1+2+n。并联系统:设系统各个子系统的可靠性分别为R1,R2,Rn,则系统的可靠性R=1-(1-R1)*(1-R2)*(1-Rn),并联的子系统越多,系统的可靠性提高。如果所有的子系统的失效率为0,则系统的失效率为;在并联系统中只有一个子系统是真正需要的,其余n-1个子系统称为冗余子系统。模冗余系统:m模冗余系统由m个(m=2n+1)相同的子系统和一个表决器组成,经过表决器表决后,m个子系统中占多数相同结果的输出作为系统的输出。在m个子系统中,只要有n+1个以上子系统能正常工作,系统就能正常工作,输出正确结果。如果所有的子系统的可靠性为R0,
4、则m模冗余系统的可靠性R为。性能评价方法时钟频率法:计算机的时钟频率在一定程度上反映了机器速度;相同体系结构的机器,主频越高,速度越快。由于体系结构的不同、指令系统的不同、各指令使用的机器周期的不同,平均指令执行速度仅仅是对各种指令执行速度加权后的平均值,并不能完全反映实际程序执行的速度。指令执行速度法:表示机器运算速度的单位是MIPS(每秒百万条指令),有峰值MIPS、基准程序MIPS和以特定系统为基准的MIPS。用来衡量计算机的科学计算速度,MFLOPS(每秒百万次浮点运算速度),有峰值MFLOPS和以基准程序测得的MFLOPS;可用于比较和评价在同一系统上求解同一问题的不同算法的性能,已
5、可用于在同一源程序、同一编译器以及相同的优化措施,在同样运行环境下以不同系统测试得到的浮点运算速度;但没有考虑运算部件与存储器、I/O系统等速度之间相互协调等因素。等效指令速度法:通过各类指令在程序中所占比例进行计算得到。若各类指令的执行时间为ti,则等效指令的执行时间,n为指令类型数;由于没有考虑数据的长度、高速缓存的命中率、流水线的效率导致的不固定的指令执行时间,采用等效指令速度法可能会偏离实际。数据处理速率法(PDR):采用计算PDR值的方法来衡量机器性能,PDR值越大,机器性能越好;PDR与每条指令和每个操作数的平均位数以及每条指令的平均运算速度有关;PDR值主要对CPU和主存储器的速
6、度进行衡量,允许并行处理和指令预取的功能,但不适合衡量机器的整体速度,没有涉及高速缓存、多功能部件等技术对性能的影响。1991年9月停止使用。综合理论性能法(CTP):美国政府为限制较高性能计算机出口所设置的运算部件综合性能估算方法。CTP以每秒百万次理论运算MTOPS表示,1991年9月1日启用。CTP的估算方法是首先计算出处理部件每个计算单元(如定点加法单元、定点乘法单元、浮点加法单元、浮点乘法单元)的有效计算率R,再按不同字长加以调整,得出该计算单元的理论性能TP,所有组成该处理部件的计算单元TP的总和即为综合理论性能CTP。基准程序法(Benchmark):Khrystone基准程序:
7、综合性的整数基准测试程序,用C语言编写。Linpack基准程序:主要操作是浮点加法和浮点乘法操作,结果用MFLOPS表示,用FORTRAN语言编写。Whetstone基准程序:主要由执行浮点运算、功能调用、数组变址、条件转移和超越函数的程序组成,测试结果用Kwips表示,用FORTRAN语言编写。SPEC基准程序:SPEC CPU2000基准程序可测试CPU、存储器系统和编译器的性能,测试结果以SPECmark、SPECint和SPECfp来表示。TPC基准程序:由TPC开发的评价计算机事务处理性能的测试程序,用以评测计算机在事务处理、数据库处理、企业管理与决策支持系统等方面的性能,评测结果用
8、每秒完成的事务处理数TPC来表示。TPC-A:用于评价在联机事务处理环境下的数据库和硬件的性能,不同系统之间用性能价格比进行比较;TPC-B:测试不包括网络的纯事务处理量,用于模拟企业计算环境;TPC-C:测试联机订货系统;TPC-D:测试决策支持系统;TPC-W:基于Web商业的测试标准,可看作是服务器的测试标准。软件容错高质量软件的可靠性技术分为两类:避错技术,在开发过程中不让差错潜入软件的技术,是进行质量管理,使软件具有应有质量所必不可少的技术,软件工程中先进的软件开发和管理技术,在管理中避开错误。容错技术,对某些无法避开的错误使其影响降到最小的技术,使错误发生时不影响系统的特性,主要采
9、用冗余手段。冗余是指对所有实现系统规定功能来说是多余的资源,包括硬件、软件、信息和时间,通过冗余资源的加入使系统的可靠性得到较大的提高。主要的冗余技术:结构冗余、信息冗余、时间冗余、冗余附加。故障的恢复策略有两种:前向恢复:使当前计算继续往下走,把系统恢复成连贯的正确状态,弥补当前状态不连贯的情况;需要有错误的详细说明。后向恢复:系统恢复到前一个正确状态,然后继续执行;不适合于实时处理场合。软件容错的主要目的是提供足够的冗余信息和算法程序,使系统在实际运行时能够及时发现程序设计的错误,采取弥补措施,来提高软件的可靠性,保证整个计算机系统的正常运行。软件容错技术主要有:恢复块方法:动态屏蔽技术,
10、采用后向恢复策略,提供具有相同功能的主块和几个后备块,一个块就是一个执行完整的程序段。主块首先投入运行,结束后进行验证测试,如果不通过,系统把现场恢复后由后备块执行,以此类推,直到耗尽所有后备块,产生异常处理。设计恢复块时,要保证主块和后备块之间的独立性,避免相关错误的产生,使两者的共性错误降到最低。验证测试程序完成故障检测的功能,必须保证验证测试程序的正确性。N版本程序设计:静态故障屏蔽技术,采用前向恢复策略,用n个具有相同功能的程序同时执行,结果通过多数表决来决定。N版本程序必须由不同的人使用不同的设计方法、不同的程序语言、不同的开发环境来实现,以减少N版本程序在表决点上相关错误的概率;必须解决程序运行的同步问题。N版本程序设计采用时间冗余,重复计算,通过表决产生正确结果。防卫式程序设计:不采用任一种传统的容错技术,对于程序中存在错误或不一致性,通过在程序中包括错误检查代码和错误恢复代码,一旦发生错误,程序就能撤销错误状态,恢复到一个已知的正确状态中去。其实现的策略包括错误检测、错误估计和错误恢复等三个方面。提高软件容错能力,可以通过计算机平台环境、软件工程和构造故障处理模块等途径,也可以利用高级程序设计语言本身的容错能力采取相应的策略。专心-专注-专业