《计算机原理》PPT课件.ppt

上传人:wuy****n92 文档编号:70498982 上传时间:2023-01-21 格式:PPT 页数:37 大小:472.50KB
返回 下载 相关 举报
《计算机原理》PPT课件.ppt_第1页
第1页 / 共37页
《计算机原理》PPT课件.ppt_第2页
第2页 / 共37页
点击查看更多>>
资源描述

《《计算机原理》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《计算机原理》PPT课件.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、计算机原理计算机原理第四章第四章 评估和理解计算机性能评估和理解计算机性能2本讲简要说明本讲简要说明p目的目的与要求:掌握计算机中的与要求:掌握计算机中的性能评价性能评价 p授课重点:授课重点:计算机性能指标计算机性能指标p授课难点:授课难点:如何合理评价计算机的性能如何合理评价计算机的性能p阅读章节:阅读章节:Computer Organization and Design第第4章,章,计算机原理和设计计算机原理和设计第第1章第章第4节节p作业安排:作业安排:Computer Organization and Design P272 4.1、4.2、4.3(选做选做)、4.10、4.11和和

2、4.14(选做选做)题题3p制造成本(制造成本(manufacturing cost)p衡量计算机性能的基本指标衡量计算机性能的基本指标n响应时间(响应时间(Response Time)l执行时间(执行时间(Execution Time)、等待时间()、等待时间(Latency)n吞吐量(吞吐量(Throughput)l带宽(带宽(Bandwidth)n指令执行速度(指令执行速度(MIPS、MFLOPS)p计算机性能评估计算机性能评估nCPU Time=cycle time CPI Instructions/programp基准程序(基准程序(Benchmark)主要内容主要内容4单晶硅锭单晶

3、硅锭圆形薄片圆形薄片/硅抛光片硅抛光片(6/8/12寸寸,厚度不足厚度不足1mm)IC小片小片/芯片芯片不合格的用磁不合格的用磁浆点上记号浆点上记号封装:将芯片固定在塑胶或陶瓷基座上,把芯片上蚀刻出来封装:将芯片固定在塑胶或陶瓷基座上,把芯片上蚀刻出来的引线与基座底部伸出的引脚连接,盖上盖板并封焊成芯片的引线与基座底部伸出的引脚连接,盖上盖板并封焊成芯片约需约需400多道工序!多道工序!“晶圆晶圆”/大芯大芯片片Integrated Circuits Costs manufacturing process p在考察性能前,先考察成本!在考察性能前,先考察成本!5Integrated Circu

4、its Costs 公式公式Die cost =Dies per wafer=Die Yield =每个圆晶片上的小片数、集成电路成本都与芯片面积有关!每个圆晶片上的小片数、集成电路成本都与芯片面积有关!小片合格率小片合格率与芯片成本有关的因素与芯片成本有关的因素n 圆晶价格圆晶价格n 圆晶所含小片数圆晶所含小片数n 小片合格率小片合格率2)_(1(1areaDieareaperDefectx+6IC cost =Die cost +Testing cost +Packaging cost Final test yield封装成本(封装成本(Packaging cost):取决于引脚数、散热性

5、等取决于引脚数、散热性等Other CostsChipDie Package Test&Totalcostpinstype cost Assembly386DX$4 132QFP$1$4$9 486DX2$12 168PGA$11$12$35 PowerPC 601$53 304QFP$3$21$77 HP PA 7100$73 504PGA$35$16$124 DEC Alpha$149 431PGA$30$23$202 SuperSPARC$272 293PGA$20$34$326 Pentium$417 273PGA$19$37$473 7性能的定义性能的定义如何理解如何理解“一台计算机

6、的性能比另一台好一台计算机的性能比另一台好”的含义?先考虑民的含义?先考虑民航客机的航客机的“性能性能”:续航能力、巡航速度、载客量、运载能力:续航能力、巡航速度、载客量、运载能力?nTime of Concorde vs.Boeing 747?巡航速度上巡航速度上 Concorde 比比Boeing 747快:快:1350/610=2.2倍倍 Concorde的性能更好!的性能更好!nThroughput of Boeing 747 vs.Concorde?运载能力上运载能力上 Boeing 747 比比Concorde大:大:286,700/178,200=1.6倍倍 Boeing 747

7、的性能更好!的性能更好!若考虑制造成本,则性能评价更复杂若考虑制造成本,则性能评价更复杂不同的性能评价标准会导致不同的结论!不同的性能评价标准会导致不同的结论!8计算机性能的基本评价指标计算机性能的基本评价指标p 计算机也有两种不同的性能计算机也有两种不同的性能n Time to do the task 响应时间(响应时间(response time):完成一个任务所需的总时间):完成一个任务所需的总时间执行时间(执行时间(execution time)等待时间或时延(等待时间或时延(latency)n Tasks per day,hour,sec,ns.吞吐率(吞吐率(throughput)

8、:一定时间内所完成的工作量):一定时间内所完成的工作量带宽(带宽(bandwidth)p不同应用场合用户关心的性能不同不同应用场合用户关心的性能不同n吞吐率高的场合吞吐率高的场合多媒体应用多媒体应用(音音/视频播放要流畅视频播放要流畅)n响应时间短的场合响应时间短的场合事务处理系统事务处理系统(存存/取款的速度要快取款的速度要快)n吞吐率高且响应时间短的场合吞吐率高且响应时间短的场合ATM、文件服务器、文件服务器、Web服务器等服务器等SKIP9不同层次上对吞吐率性能的度量不同层次上对吞吐率性能的度量(millions)of Instructions per second MIPS(milli

9、ons)of(F.P.)operations per second MFLOPSCycles per second(clock rate)Megabytes per second(带宽带宽)Answers per hourOperations per secondCompilerProgramming LanguageApplicationDatapathControlTransistorsWires PinsISAFunction UnitsBACK10吞吐率与响应时间吞吐率与响应时间Do the following changes to a computer system increase

10、 throughput,decrease response time,or both?1)Replacing the processor in a computer with a faster version2)Adding additional processors to a system that uses multiple processors for separate tasksfor example,searching the World Wide Web.解:缩短响应时间通常也意味着提高吞吐率解:缩短响应时间通常也意味着提高吞吐率(1)响应时间与吞吐率都能得到一定程度的改善响应时间

11、与吞吐率都能得到一定程度的改善(2)单个任务的处理速度并不会加快,只有吞吐率得单个任务的处理速度并不会加快,只有吞吐率得到了提高。如果请求处理的数量超过系统的吞吐能到了提高。如果请求处理的数量超过系统的吞吐能力,请求在系统排队等待处理,请求在队列等待时力,请求在系统排队等待处理,请求在队列等待时间减少,则响应时间也会相应有所改善间减少,则响应时间也会相应有所改善所以,执行时间与吞吐率的变化常常是相互影响所以,执行时间与吞吐率的变化常常是相互影响11计算机性能的基本评价指标计算机性能的基本评价指标 X is n times faster than Y meansExTime(Y)Performa

12、nce(X)=n ExTime(X)Performance(Y)p基本的性能评价标准是:基本的性能评价标准是:CPU的执行时间的执行时间p相对性能用执行时间的倒数来表示!相对性能用执行时间的倒数来表示!Performance=1/Execution Time例:相对性能计算例:相对性能计算 If computer A runs a program in 10 senconds and computer B runs the same program in 15 senconds,how much faster is A than B?12计算机性能的测量计算机性能的测量p比较计算机的性能时,用

13、执行时间来衡量比较计算机的性能时,用执行时间来衡量n完成同样工作量所需时间最短的那台计算机性能最好完成同样工作量所需时间最短的那台计算机性能最好n处理器时间往往被多个程序共享处理器时间往往被多个程序共享使用,因此,用户感觉到使用,因此,用户感觉到的程序执行时间并不是程序真正的执行时间的程序执行时间并不是程序真正的执行时间n通常把用户感觉到的响应时间分成:通常把用户感觉到的响应时间分成:lCPU时间:时间:CPU真正花在程序执行上的时间。包括两部分:真正花在程序执行上的时间。包括两部分:用户用户CPU时间:用来运行用户代码的时间时间:用来运行用户代码的时间 系统系统CPU时间:为了执行用户程序而

14、需要运行操作系统程时间:为了执行用户程序而需要运行操作系统程序的时间序的时间l其他时间:等待其他时间:等待I/O操作完成或操作完成或CPU花在其他用户程序的时间花在其他用户程序的时间n系统性能和系统性能和CPU性能是不等价的,有一定的区别性能是不等价的,有一定的区别l系统性能系统性能(System performance):表示系统响应时间,与:表示系统响应时间,与CPU外的其他部分也都有关系外的其他部分也都有关系lCPU性能性能(CPU performance):表示用户:表示用户CPU时间时间本章主要讨论本章主要讨论CPU性能,即:性能,即:CPU真正用在用户程序执行上真正用在用户程序执行

15、上的时间的时间13CPU执行时间的计算执行时间的计算时钟周期:时钟周期:所有计算机都有一个固定频率的硬件时钟,它所所有计算机都有一个固定频率的硬件时钟,它所产生的离散时间间隔称为时钟周期产生的离散时间间隔称为时钟周期评价评价CPU性能的最重要指标是性能的最重要指标是CPU执行时间执行时间CPU execution time=CPU clock cycles/pgm clock rate =CPU clock cycles/pgm clock cycle time CPU clock cycles/pgm=Instrs/pgm CPI(avg.clock cycles per instr)CPI

16、=CPU clock cycles/pgm Instructions/pgm CPI 用来衡量以下各方面的综合结果用来衡量以下各方面的综合结果n Instruction Set Architecturen Implementation of that architecturen program 14Aspects of CPU PerformanceCPU time =Seconds =Instructions Cycles Seconds Program Program Instruction CycleInstr.countCPI Clock rateProgramCompilerInst

17、r.Set Arch.OrganizationTechnology思考:三个因素与哪些方面有关?思考:三个因素与哪些方面有关?15Aspects of CPU Performance Instr.count CPI Clock rateProgram X XCompiler X (X)Instr.Set Arch.X XOrganization X XTechnology XCPU time =Seconds =Instructions Cycles Seconds Program Program Instruction Cycle问题:问题:ISA、计算机组织(、计算机组织(Organiza

18、tion)、计算机实现技)、计算机实现技术(术(Technology)三者的关系是什么?)三者的关系是什么?16Architecture=Instruction Set Arch.+OrganizationComputer DesignComputer Hardware Designn Machine ImplementationlLogic Designers ViewlProcessor ArchitecturelComputer OrganizationConstruction EngineerInstruction Set DesignnMachine LanguagelCompile

19、r ViewlComputer ArchitecturenInstruction Set ProcessorBuilding Architect“建筑设计师建筑设计师”功能定义与设计功能定义与设计“建造工程师建造工程师”考虑用什么材料,如何布线等考虑用什么材料,如何布线等如:是否提供如:是否提供“乘法指令乘法指令”是是ISA设计考虑的问题;如何实现乘法指令设计考虑的问题;如何实现乘法指令(用专门的乘法器还是用一个加法器用专门的乘法器还是用一个加法器+移位器实现移位器实现)是组成是组成(Organization)考虑的问题;如何布线、用什么材料、工艺设计等是计算机实现技术考虑的问题;如何布线、用

20、什么材料、工艺设计等是计算机实现技术(Technology)考虑的问题考虑的问题17Instruction Set Architecture.the attributes of a computing system as seen by the programmer,i.e.the conceptual structure and functional behavior,as distinct from the organization of the data flows and controls the logic design,and the physical implementation

21、.Amdahl,Blaw,and Brooks,1964n Organization of Programmable Storage(程序员可见存储的组织程序员可见存储的组织)如:寄存器个数、名称、长度;内存单元长度、主存地址长度如:寄存器个数、名称、长度;内存单元长度、主存地址长度n Data Types&Data Structures(数据类型和结构数据类型和结构)Encodings&Representations(编码和表示编码和表示)n Instruction Formats(指令格式指令格式)n Instruction(or Operation Code)Set(操作码集合:指令功能

22、操作码集合:指令功能)n Modes of Addressing and Accessing Data Items and Instructions (寻址方式、数据寻址方式、数据/指令的存取方式指令的存取方式)n Exceptional Conditions and handle(异常条件和处理异常条件和处理)主要内容包括:主要内容包括:18OrganizationLogic Designers ViewISA LevelFUs&Interconnectn Capabilities&Performance Characteristics of Principal Functional Uni

23、ts(主要功能部件的能力和工作特性)主要功能部件的能力和工作特性)(e.g.,Registers,ALU,Shifters,Memory,Cache,etc.)n Ways in which these components are interconnected(互(互连方式)连方式)n nature of information flows between components(部件间(部件间的信息流动方式)的信息流动方式)n logic and means by which such information flow is controlled(部件间信息流动的控制逻辑和控制方法)(部件间

24、信息流动的控制逻辑和控制方法)主要内容包括:主要内容包括:n 为实现为实现ISA,该如何安排功能部件,该如何安排功能部件n 寄存器传送级的描述寄存器传送级的描述19Organizational Trade-offs3 factors:Where are they?Instruction Count(Mix)CPICompilerProgramming LanguageApplicationDatapathControlTransistors Wires PinsISAFunction UnitsCycle Time3 factors:How are they related?n CPI的减少可

25、能会增加时钟周期的长度的减少可能会增加时钟周期的长度n 缩短时钟周期可能会增加指令的条数缩短时钟周期可能会增加指令的条数n 改变改变IS以减少指令条数会使时钟周期变长以减少指令条数会使时钟周期变长n 即使是在同一台机器上的同一个问题,最即使是在同一台机器上的同一个问题,最少指令条数的程序不一定执行的最快少指令条数的程序不一定执行的最快因此,必须在各方面进行权衡!因此,必须在各方面进行权衡!CPU time =Instruction counts CPI Cycle Time20Example1:提高性能:提高性能Our favorite program runs in 10 sec on ma

26、chine A,which has a 4GHz clock.We are trying to design a machine B with faster clock rate so as to reduce the execution time to 6 sec.The increase of clock rate will affect the rest of the CPU design,causing B to require 1.2 times as many clock cycles as machine A for this program.What clock rate sh

27、ould be?Answer:CPU time A=CPU clock cycle A/clock rate A CPU clock cycle A=10 sec 4 109 Clock rate B=CPU clock cycle B/CPU time B =1.2 40 109/6=8GHz机器机器B的频率是的频率是A的两倍,但机器的两倍,但机器B的速度并不是的速度并不是A的两倍!的两倍!21如何计算如何计算CPI?对于某一条特定的指令而言,其对于某一条特定的指令而言,其CPI是一个确定的值。但是,是一个确定的值。但是,对于某一类指令、或一个程序、或一台机器而言,其对于某一类指令、或一个程

28、序、或一台机器而言,其CPI是一是一个平均值,表示该类指令或该程序或该机器的指令集中每条指个平均值,表示该类指令或该程序或该机器的指令集中每条指令执行时平均需要多少时钟周期。令执行时平均需要多少时钟周期。设设CPIi、Fi是每类指令的是每类指令的CPI和在程序中出现频率,则程序综合和在程序中出现频率,则程序综合CPI:CPI =where=niiiFCPI1CountnInstructioCFii_=CPU时间时间=时钟周期时钟周期 设设CPI i、C i为第为第 i类指令的类指令的CPI和指令条数,则程序总时钟数:和指令条数,则程序总时钟数:=niiiCCPI1=niiiCCPI1总时钟数总

29、时钟数=所以,所以,CPI=(CPU 时间时间时钟频率时钟频率)/指令条数指令条数 =总时钟周期数总时钟周期数/指令条数指令条数已知已知CPU时间、时钟频率、总时钟数、指令条数,则程序综合时间、时钟频率、总时钟数、指令条数,则程序综合CPI:问题:指令的问题:指令的CPI、机器的、机器的CPI、程序的、程序的CPI各反映哪方面的性能?各反映哪方面的性能?单靠单靠CPI不能反映不能反映CPU的性能!为什么?如:单周期处理器的性能!为什么?如:单周期处理器CPI=1,但性能差!,但性能差!22Instruction type and Instruction frequencies in the e

30、xecution of a program:Op FreqCycles ALU 43%1 Load 21%2 Store 12%2 Branch 24%2 Example2:CPI的计算的计算Question:What is the average CPI of the machine?CPI=143%+221%+212%+224%=1.5723Example3:性能公式的应用:性能公式的应用Suppose we have two implementations of the same instruction set.Machine A has a clock cycle time of 25

31、0ps and an average CPI of 2.0 for some program.Machine B has a clock cycle time of 500 ps and an average CPI of 1.2 for the same program.Which is faster?And by how much?Let I denote the number of instructions of the programCPU time A=I 2.0 250=500 I(ps)CPU time B=I 1.2 500=600 I(ps)Machine A is 1.2

32、faster than B.在此,又看到三个因素之间的相互影响。在此,又看到三个因素之间的相互影响。相同相同IS对于同一个程序,其指令序列是一样的,当然条数相同!对于同一个程序,其指令序列是一样的,当然条数相同!CPU 时间时间=指令条数指令条数 CPI 时钟周期时钟周期CPU time =Instruction counts CPI Cycle Time24程序性能的影响程序性能的影响25Example 4:比较不同的代码段:比较不同的代码段Instruction classCPI for this instruction classA1B2C3ISA has 3 kinds of inst

33、ructions:One program has 2 code sequences:Code SequenceInstruction counts for instruction classABC12122411Which code sequence has more instructions?Which will be faster?What is the CPI for each sequence?序列序列1 有有5条指令条指令;序列序列2 有有 6条条.序列序列1 需需 21+12+23=10 cycles;序列序列2 需需 41+12+13=9 cycles 序列序列1 的的 CPI=

34、10/5=2;序列序列2 的的CPI=9/6=1.5虽然序列虽然序列2的指令条数的指令条数更多,但速度更快!更多,但速度更快!26Marketing Metrics(产品宣称指标)(产品宣称指标)p MIPS=Instruction Count/Execution Time 106=Clock Rate/CPI 106n一种用来代替执行时间的指标一种用来代替执行时间的指标nMillion Instructions Per Seconds因为每条指令执行时间不同,所以因为每条指令执行时间不同,所以MIPS是一个平均值是一个平均值n 不同机器的指令集不同不同机器的指令集不同n 程序由不同的指令混合

35、而成程序由不同的指令混合而成n 指令使用的频度动态变化指令使用的频度动态变化n Peak MIPS(不实用)(不实用)MIPS数不能说明性能的好坏?数不能说明性能的好坏?p MFLOPS=FP Operations/Execution Time 106Million Floating-point Operations Per Secondn 与机器相关性大与机器相关性大n 并不是程序中花时间的部分并不是程序中花时间的部分用用MIPS数表示性数表示性能有没有局限能有没有局限?用用MFLOPS数表示数表示性能也有局限!性能也有局限!27Example:MIPS数不可靠!数不可靠!Consider

36、the computer with three instruction classes and CPI measurements from the example 4.Now suppose we measure the code for the same program from two different compilers and obtain the following data:Assume that the computers clock rate is 4GHz.Which code sequence will execute faster according to MIPS?A

37、ccording to execution time?CPU clock cycles 1=(51+12+13)109=10 109 CPU clock cycles 2=(101+12+13)109=15 109 Execution time 1=10 109/4 109=2.5 secondsExecution time 2=15 109/4 109=3.75 secondsMIPS 1=(5+1+1)109/2.5 106=2800 MIPS 2=(10+1+1)109/3.75 106=3200 结论:结论:来自来自compiler2产生代码的产生代码的MIPS高,高,而而来自来自co

38、mpiler1产生产生的代码的执行时间快。的代码的执行时间快。28选择性能评价程序(选择性能评价程序(Benchmarks)p用基准程序来评测计算机的性能用基准程序来评测计算机的性能n基准测试程序是专门用来进行性能评价的一组程序基准测试程序是专门用来进行性能评价的一组程序n不同用户使用的计算机用不同的基准程序不同用户使用的计算机用不同的基准程序n基准程序通过运行实际负载来反映计算机的性能基准程序通过运行实际负载来反映计算机的性能n最好的基准程序是用户实际使用的程序或典型的简单程序最好的基准程序是用户实际使用的程序或典型的简单程序p基准程序的缺陷基准程序的缺陷n现象:基准程序的性能与某段短代码密

39、切相关时,会被利现象:基准程序的性能与某段短代码密切相关时,会被利用以得到不当的性能评测结果用以得到不当的性能评测结果n手段:硬件系统设计人员或编译器开发者针对这些代码片手段:硬件系统设计人员或编译器开发者针对这些代码片段进行特殊的优化,使得执行这段代码的速度非常快段进行特殊的优化,使得执行这段代码的速度非常快例例1:Intel Pentium处理器运行处理器运行SPECint时用了公司内部使用的特时用了公司内部使用的特殊编译器,使其性能极高殊编译器,使其性能极高例例2:矩阵乘法程序:矩阵乘法程序SPECmatrix300有有99%的时间运行在一行语句的时间运行在一行语句上,有些厂商用特殊编译

40、器优化该语句,使性能达上,有些厂商用特殊编译器优化该语句,使性能达VAX11/780的的729.8倍倍!29用于性能评估的程序用于性能评估的程序p(Toy)Benchmarks(短小基准程序)(短小基准程序)n程序短小容易编译,便于仿真或手工编译,因而可用于对新程序短小容易编译,便于仿真或手工编译,因而可用于对新开发的机器进行性能评测开发的机器进行性能评测.(因为新机器往往没有配编译器)(因为新机器往往没有配编译器)n大小:大小:10-100 line例:例:sieve,puzzle,quicksortn缺陷:不是实际使用的程序,只用于新开发的计算机。缺陷:不是实际使用的程序,只用于新开发的计

41、算机。pSynthetic Benchmarks(综合基准程序)(综合基准程序)n目的:试图用一个基准程序去涵盖一系列基准程序的特征目的:试图用一个基准程序去涵盖一系列基准程序的特征n做法:使各种语句的执行频度与一系列基准程序中的频度一做法:使各种语句的执行频度与一系列基准程序中的频度一致致例:例:Whetstone(Algol 60Fortran),Dhrystone(AdaC)n缺陷:不是实际用的程序,可特殊优化使评测结果优,但实缺陷:不是实际用的程序,可特殊优化使评测结果优,但实际并不如此际并不如此pKernels(核心程序段)(核心程序段)n实际程序中的耗时较多的关键片断实际程序中的耗

42、时较多的关键片断n通常用在科学计算领域测试某个特殊功能的性能通常用在科学计算领域测试某个特殊功能的性能例:例:Livermore loops(21 loops),Linpack(linear algebra)pReal programs(频繁使用的实际程序)(频繁使用的实际程序)e.g.,gcc,spice30Successful Benchmark:SPEC p1988年,年,5家公司(家公司(Sun,MIPS,HP,Apollo,DEC)联合提)联合提出出Systems Performance Evaluation Committee(SPEC)pSPEC给出一组标准的测试程序、标准输入和

43、测试报告。给出一组标准的测试程序、标准输入和测试报告。它们是一些实际的程序,包括它们是一些实际的程序,包括 OS calls、I/O等等p版本版本 89:10 programs=4 for integer+6 for FP,用每个程用每个程序的执行时间求出一个综合性能指标序的执行时间求出一个综合性能指标 p版本版本92:SPECInt92(6 integer programs)and SPECfp92(14 floating point programs)n整数和浮点数单独提供衡量指标:整数和浮点数单独提供衡量指标:SPECInt92和和SPECfp92n增加增加 SPECbase:禁止使用任

44、何与程序有关的编译优化开关禁止使用任何与程序有关的编译优化开关p版本版本95:8 int+10fpp较新版本:较新版本:include SPEC HPC96,SPEC JVM98,SPEC WEB99,SPEC OMP2001.SPEC CPU2000 http:/for more detailsn“benchmarks useful for 3 years”nBase machine is changed from VAX-11/780 to Sun SPARC 10/4031如何给出综合评价结果如何给出综合评价结果?Program 1:1 sec on machine A,10 sec o

45、n machine BProgram 2:1000 sec on A,100 sec on BWhat are your conclusions?n A is 10 times faster than B for program1.n B is 10 times faster than A for Program2.p一种简单的综合评价指标一种简单的综合评价指标Total execution time B is 1001/110=9.1 times faster than A实际上,须考虑每个程序在作业中的使用频度,即加权平均实际上,须考虑每个程序在作业中的使用频度,即加权平均问题:如果用一组

46、基准程序在不同的机器上测出了问题:如果用一组基准程序在不同的机器上测出了运行时间,那么如何综合评价机器的性能呢?运行时间,那么如何综合评价机器的性能呢?例:例:无法比较无法比较A和和B的的好坏,须用一个好坏,须用一个综合的值来表示综合的值来表示32综合性能评价的方法综合性能评价的方法p可用两种平均值来评价性能可用两种平均值来评价性能nArithmetic mean(算术平均算术平均):求和后除:求和后除nnGeometric mean(几何平均几何平均):求积后开根号:求积后开根号np根据算术平均执行时间能得到程序总平均执行时间根据算术平均执行时间能得到程序总平均执行时间p根据几何平均执行时间

47、不能得到程序总的执行时间根据几何平均执行时间不能得到程序总的执行时间p执行时间的规格化执行时间的规格化(测试机器相对于参考机器的性能测试机器相对于参考机器的性能)ntime on reference machine time on measured machine p平均规格化执行时间不能用算术平均来计算,而应平均规格化执行时间不能用算术平均来计算,而应该用几何平均该用几何平均nprogram A going from 2 seconds to 1 second as important as program B going from 2000 seconds to 1000 seconds.

48、(算术平均值不能反映这一点!)(算术平均值不能反映这一点!)算术平均和几何平均各有长处,可灵活使用!算术平均和几何平均各有长处,可灵活使用!33Impact of Means on SPECmark89 for IBM 550 Ratio to VAX:Time:Weighted Time:ProgramBefore AfterBefore AfterBefore Aftergcc302949518.919.22espresso353465677.647.86spice47475105105.695.69doduc464941385.815.45nasa7781442581403.431.86

49、li34341831837.867.86eqntott404028286.686.68matrix300787305863.430.37fpppp908734352.973.07tomcatv13313820192.011.94Mean 547212410854.4249.9 Geometric Arithmetic Weighted Arith.Ratio 1.33 Ratio 1.16 Ratio1.09 注:注:“After”表示表示加了特加了特殊编译殊编译开关后开关后的结果。的结果。好的评好的评价标准价标准应该对应该对特殊处特殊处理不敏理不敏感!感!该表反映了不同的均值计算法得到的结论

50、可能不同。该表反映了不同的均值计算法得到的结论可能不同。34性能、功耗及能量效率性能、功耗及能量效率p功耗:功耗:能耗能耗=CV2 fp功耗逐渐成为处理器性能的主要限制功耗逐渐成为处理器性能的主要限制p电源的消耗通常是与性能及价格同样重要的因素电源的消耗通常是与性能及价格同样重要的因素pCMOS电路可以通过降低频率来降低电能消耗电路可以通过降低频率来降低电能消耗n最大时钟频率最大时钟频率n可调时钟频率可调时钟频率相对性能相对性能相对效率相对效率35计算机某方面改进,系统的性能能成比例提高吗?计算机某方面改进,系统的性能能成比例提高吗?例:假设某个程序在某台计算机上运行时所需的时间是例:假设某个

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁