《高等计算机体系结构第1章.ppt》由会员分享,可在线阅读,更多相关《高等计算机体系结构第1章.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高等计算机系统结构高等计算机系统结构主讲主讲 任国林任国林1一、课程目标一、课程目标1.1.并行性理论的研究并行性理论的研究 并行计算机系统结构与系统模型;并行计算机系统结构与系统模型;通信系统模型及编程模型;通信系统模型及编程模型;并行计算机性能评价方法;并行计算机性能评价方法;可扩展性原理及方法。可扩展性原理及方法。2.2.并行技术和可扩展系统结构的研究并行技术和可扩展系统结构的研究 微处理器并行技术;微处理器并行技术;分布式存储器和时延容忍技术;分布式存储器和时延容忍技术;互连网络技术;互连网络技术;可扩展多处理器。可扩展多处理器。2二、参考教材二、参考教材1 1、并行计算机系统结构,、
2、并行计算机系统结构,David E.CullerDavid E.Culler等著,李晓明等译,等著,李晓明等译,机械工业出版社,机械工业出版社,2003.12003.12 2、可扩展并行计算、可扩展并行计算技术、结构与编程,技术、结构与编程,黄铠、徐志伟著,陆黄铠、徐志伟著,陆鑫达鑫达等译等译,机械工业出版社机械工业出版社,2000.53 3、计算机系统结构(第二版)、计算机系统结构(第二版),郑纬民、汤志忠著郑纬民、汤志忠著,清华大学,清华大学出版社,出版社,1998.94 4、高等计算机系统结构,黄铠著,高等计算机系统结构,黄铠著,王鼎兴等译王鼎兴等译,清华大学出版,清华大学出版社,社,2
3、001.115 5、计算机系统结构、计算机系统结构一种定量的方法(第二版)一种定量的方法(第二版),John L.John L.HennessyHennessy等著,郑纬民等译等著,郑纬民等译,清华大学出版社,清华大学出版社,2002.83第一章第一章 并行计算机系统结构并行计算机系统结构概述概述 4第一节第一节 计算机系统结构概念计算机系统结构概念 一、一、计算机系统结构概念计算机系统结构概念 1 1、计算机系统层次结构、计算机系统层次结构应用语言级应用语言级高级语言级高级语言级汇编语言级汇编语言级操作系统级操作系统级传统机器级传统机器级微程序机器级微程序机器级电子线路电子线路L5虚拟机虚拟
4、机L4虚拟机虚拟机L3虚拟机虚拟机L2虚拟机虚拟机翻译(应用程序包)翻译(应用程序包)翻译(编译程序)翻译(编译程序)翻译(汇编程序)翻译(汇编程序)软硬件交界面软硬件交界面物理机器物理机器解释解释硬件直接执行硬件直接执行硬件硬件固件固件系统系统软件软件虚虚拟拟机机器器实实际际机机器器应用应用软件软件部分解释部分解释52 2、计算机系统设计方法、计算机系统设计方法(1 1)由上向下)由上向下 从软件到硬件,适合专用机的设计。从软件到硬件,适合专用机的设计。(2 2)由下向上)由下向上 从硬件到软件,适合通用机的设计。从硬件到软件,适合通用机的设计。两种方法结果:两种方法结果:形成软、硬脱节。形
5、成软、硬脱节。(3 3)从中间开始)从中间开始 从软、硬件交界面开始设计。从软、硬件交界面开始设计。要求不断进行优化设计要求不断进行优化设计交互、评价的工具和方法。交互、评价的工具和方法。63 3、系统结构定义、系统结构定义 精确定义:精确定义:机器语言程序员、编译程序编写者机器语言程序员、编译程序编写者所看到的计所看到的计算机的算机的结构和功能特性结构和功能特性。系统结构含义:系统结构含义:实际上是研究计算机系统中实际上是研究计算机系统中软、硬件之间软、硬件之间的界面定义的界面定义及及其上下的功能分配其上下的功能分配。基本定义:基本定义:程序员程序员所看到的计算机的所看到的计算机的属性属性。
6、系统结构、计算机组成、物理实现三者关系:系统结构、计算机组成、物理实现三者关系:1:n 1:n1:n 1:n 系统结构系统结构 -计算机组成计算机组成-物理实现物理实现73 3、系统结构包含内容、系统结构包含内容 数据表示、寻址方式、指令系统、数据表示、寻址方式、指令系统、寄存器组织、寄存器组织、存储系统、存储系统、中断机构、中断机构、I/OI/O结构、结构、机器工作状态定义和切换、信息保护;机器工作状态定义和切换、信息保护;计算机组成包含内容(不属于系统结构内容):计算机组成包含内容(不属于系统结构内容):数据通路宽度、专用部件设计、各种数据通路宽度、专用部件设计、各种OSOS共享程度、功共
7、享程度、功能部件并行度、控制机构组成方式、排队与缓冲技术、预估与能部件并行度、控制机构组成方式、排队与缓冲技术、预估与预判技术、可靠性技术等。预判技术、可靠性技术等。84 4、计算机系统结构设计、计算机系统结构设计 系统结构设计步骤:系统结构设计步骤:a.a.需求分析需求分析-主要在应用环境、所用语言的种类及特性、主要在应用环境、所用语言的种类及特性、对对OSOS的特殊要求、所用外设特性、技术经济指标、市场分析等的特殊要求、所用外设特性、技术经济指标、市场分析等方面;方面;b.b.需求说明需求说明-主要包括设计准则、功能说明、器件性能主要包括设计准则、功能说明、器件性能说明等;说明等;c.c.
8、概念性设计概念性设计-进行软、硬件功能分析,确定机器级界进行软、硬件功能分析,确定机器级界面;面;d.d.具体设计具体设计-机器级界面各方面的确切定义,可考虑几机器级界面各方面的确切定义,可考虑几种方案;种方案;e.e.优化优化-反复进行优化设计及性能评价。反复进行优化设计及性能评价。95 5、并行并行体系结构体系结构 并行并行计计算机算机是一组相互通信、相互协作以快速求解大型问是一组相互通信、相互协作以快速求解大型问题的处理单元。题的处理单元。并行并行体系结构:体系结构:由宏体系结构、微体系结构两部分组成。由宏体系结构、微体系结构两部分组成。微体系结构:微体系结构:围绕处理器及它的壳;围绕处
9、理器及它的壳;宏体系结构:宏体系结构:并行计算机系统的整体结构。并行计算机系统的整体结构。并行并行体系结构研究重点:体系结构研究重点:并行并行性:性:算法、通信、互连算法、通信、互连 存储系统:存储系统:速度、数据一致性速度、数据一致性 可扩展性:可扩展性:性能评价、加速比性能评价、加速比10二、二、计算机系统结构分类计算机系统结构分类1 1、FlynnFlynn分类法分类法 思路:思路:按指令流和数据流的多倍性进行分类。按指令流和数据流的多倍性进行分类。类型:类型:SISDSISD,SIMDSIMD,MISDMISD,MIMDMIMD四种。四种。从从MIMDMIMD到到SISDSISD性能逐
10、步下降。性能逐步下降。缺点:缺点:对流水线处理机的分类不明确。对流水线处理机的分类不明确。112 2、HandlerHandler分类法分类法 思路:思路:在系统中三个层次上按并行程度及流水线处理程度在系统中三个层次上按并行程度及流水线处理程度分类。分类。层次:层次:PCUPCU(处理控制器器或宏流水)(处理控制器器或宏流水)K K级级 ALU ALU(算逻部件或指令流水)(算逻部件或指令流水)D D级级 BLC BLC(位级电路或操作流水)(位级电路或操作流水)W W级级 分类:分类:T(C)=K K,D D,W W K K为为PCUPCU数、数、KK为可组成流水的为可组成流水的PCUPCU
11、数,数,D D为每个为每个PCUPCU中中ALUALU数、数、DD为可组成流水的为可组成流水的ALUALU数,数,W W为为ALUALU或或PEPE字长,字长,WW为所有为所有ALUALU或单或单PEPE流水线段数。流水线段数。各层次的数值越大越好。各层次的数值越大越好。123 3、冯氏冯氏分类法分类法 思路:思路:按照系统的最大并行程度进行分类。按照系统的最大并行程度进行分类。最大并行度:最大并行度:单位时间内能处理的最大二进制位数。单位时间内能处理的最大二进制位数。即:即:P Pm m=位片宽位片宽字宽字宽位片宽位片宽字宽字宽SISDSIMD(MPP)SIMDMIMD1mn1mn 最大并行
12、度的数值越大越好。最大并行度的数值越大越好。134 4、按控制方式按控制方式分类分类 类型:类型:(4 4种)种)控制流方式:控制流方式:顺序执行(冯顺序执行(冯诺依曼型)诺依曼型)数据流方式:数据流方式:操作数到位即可运算,无序执行操作数到位即可运算,无序执行 规约方式:规约方式:驱动方式与数据流相反,无序执行驱动方式与数据流相反,无序执行 匹配方式:匹配方式:非数值型应用,主要对象为符号。非数值型应用,主要对象为符号。对不同类型结构,并行程度越大越好对不同类型结构,并行程度越大越好。14三、影响三、影响计算机系统结构发展因素计算机系统结构发展因素1 1、软件对系统结构发展的影响、软件对系统
13、结构发展的影响(1 1)系列机)系列机 思想:思想:具有相同系统结构或对原系统结构进行扩充,不同具有相同系统结构或对原系统结构进行扩充,不同组成或实现技术,来实现软件可移植性。组成或实现技术,来实现软件可移植性。影响一:影响一:使得新的组成与实现技术很快得到应用,大量的使得新的组成与实现技术很快得到应用,大量的兼容产品出现,推动了系统结构的发展。兼容产品出现,推动了系统结构的发展。软件兼容种类:软件兼容种类:向上向上/向下兼容、向下兼容、向前向前/向后兼容。向后兼容。系列机要求:系列机要求:保证向后兼容,保证向后兼容,力争向上兼容。力争向上兼容。时间时间机器档次机器档次当前机器当前机器向上兼容
14、向上兼容向下兼容向下兼容高高低低向后兼容向后兼容向前兼容向前兼容15 影响二:影响二:为保持软件兼容性,系列机要求系统结构基本不为保持软件兼容性,系列机要求系统结构基本不变,又限制了系统结构的发展变,又限制了系统结构的发展。(2 2)模拟与仿真模拟与仿真 模拟:模拟:用机器语言解释实现软件移植。同时模拟机器语言、用机器语言解释实现软件移植。同时模拟机器语言、存储系统、存储系统、I/OI/O系统、控制台操作及形成虚拟操作系统。系统、控制台操作及形成虚拟操作系统。仿真:仿真:用微程序直接解释另一种指令系统。同时还需解释用微程序直接解释另一种指令系统。同时还需解释操作系统、操作系统、I/OI/O系统
15、的操作。系统的操作。异同:异同:解释程序存放位置、是否有硬件参与方面异。解释程序存放位置、是否有硬件参与方面异。除指令系统外,要解释操作系统、存储系统、除指令系统外,要解释操作系统、存储系统、I/OI/O系统系统等方面同。等方面同。16(3 3)统一高级语言方法)统一高级语言方法 存在一定的困难,争取汇编语言或机器语言的统一。存在一定的困难,争取汇编语言或机器语言的统一。导致导致开放系统开放系统(具有可移植性、交互操作性)的出现,用(具有可移植性、交互操作性)的出现,用硬件抽象层技术适应不同的硬件平台。硬件抽象层技术适应不同的硬件平台。2 2、应用对系统结构发展的影响、应用对系统结构发展的影响
16、 应用要求:应用要求:高速度、大容量、大吞吐率高速度、大容量、大吞吐率 大、巨型机趋势:大、巨型机趋势:研究新系统结构、组成技术,并推广,研究新系统结构、组成技术,并推广,向通用结构发展;向通用结构发展;中、小、微型机趋势:中、小、微型机趋势:保持价格基本不变,提高性能;保保持价格基本不变,提高性能;保持性能基本不变,降低价格。持性能基本不变,降低价格。173 3、技术对系统结构发展的影响、技术对系统结构发展的影响 器件的性能、使用方法改变、影响系统结构及组成方法。器件的性能、使用方法改变、影响系统结构及组成方法。器件发展过程:器件发展过程:通用片通用片现场片现场片半用户片半用户片用户片。用户
17、片。影响:影响:器件的发展推动系统结构与组成技术的发展,同样器件的发展推动系统结构与组成技术的发展,同样系统结构的发展要求器件不断发展。系统结构的发展要求器件不断发展。原因:原因:新结构的使用,取决于器件发展能否提供可能;新结构的使用,取决于器件发展能否提供可能;器件性能器件性能/价格提高,使新结构、组成下移速度更快;价格提高,使新结构、组成下移速度更快;器件的发展,推动算法、语言的发展;器件的发展,推动算法、语言的发展;器件的发展,改变了逻辑设计方法。器件的发展,改变了逻辑设计方法。18第二节第二节 系统设计的定量原理系统设计的定量原理 一、大概率事件优先原则一、大概率事件优先原则 基本思想
18、:基本思想:对大概率事件赋予它优先的处理权和资源使用对大概率事件赋予它优先的处理权和资源使用权,以获得全局的最优结果。权,以获得全局的最优结果。该原则是系统设计中最重要和最常用的原则。该原则是系统设计中最重要和最常用的原则。二、二、AmdahlAmdahl定律定律 基本思想:基本思想:系统中对某部件采用某种更快执行方式,所获系统中对某部件采用某种更快执行方式,所获得的系统性能的改变程度,取决于这种方式被使用的频率,或得的系统性能的改变程度,取决于这种方式被使用的频率,或所占总执行时间的比例。所占总执行时间的比例。应用:应用:使用该定律可改善使用该定律可改善“系统瓶颈系统瓶颈”性能。性能。19
19、例:例:某功能处理时间为系统原来时间的某功能处理时间为系统原来时间的40%40%,将其处理速度,将其处理速度加快加快1010倍后,整个系统性能提高多少?倍后,整个系统性能提高多少?已知:已知:fe=0.4,re=10,利用,利用Amdahl定律,则定律,则 Sp=1.56r re e=10=10时时S Sp p和和f fe e的关系如下图:的关系如下图:0.00.51.0feSp10015 结论:结论:改善某部件性能后,系统性能急剧提高,则该部件改善某部件性能后,系统性能急剧提高,则该部件为为“系统瓶颈系统瓶颈”。20三、程序访问的局部性原理三、程序访问的局部性原理 基本思想:基本思想:程序执
20、行中呈现出频繁重复使用那些最近已使程序执行中呈现出频繁重复使用那些最近已使用过的数据和指令的规律,规律指用过的数据和指令的规律,规律指时间局部性和空间局部性。时间局部性和空间局部性。时间局部性:时间局部性:近期被访问的信息,可能马上被访问;近期被访问的信息,可能马上被访问;空间局部性:空间局部性:与被访问地址相邻的地址上的信息可能会一起被访问。与被访问地址相邻的地址上的信息可能会一起被访问。应用:应用:层次存储体系设计。层次存储体系设计。四、软硬件取舍原则四、软硬件取舍原则 1.1.在现有软硬件条件下,所选方法使系统有高的性能在现有软硬件条件下,所选方法使系统有高的性能/价格;价格;2.2.所
21、选方法尽量不限制计算机组成和实现技术;所选方法尽量不限制计算机组成和实现技术;3.3.进行选择时,把如何为编译和操作系统的实现提供好的支持进行选择时,把如何为编译和操作系统的实现提供好的支持放在首位。放在首位。21第三节第三节 计算机系统性能评价计算机系统性能评价 一、计算机系统性能指标一、计算机系统性能指标 计算机性能:计算机性能:正确性、可靠性和工作能力。正确性、可靠性和工作能力。评价性能:评价性能:仅指工作能力。仅指工作能力。性能分为峰值性能和持续性能,着重评价持续性能。性能分为峰值性能和持续性能,着重评价持续性能。工作能力指标:工作能力指标:处理能力处理能力单位时间内能处理的信息量单位
22、时间内能处理的信息量(吞吐率吞吐率);响应能力响应能力响应时间、周转时间、排队时间;响应时间、周转时间、排队时间;利用率利用率TT时间内,某部分被使用时间时间内,某部分被使用时间t t与与T T的比值。的比值。22二、系统处理能力二、系统处理能力1 1、MIPSMIPS指标指标 指令除包含运算指令外,还包含取数、存数、转移等指令指令除包含运算指令外,还包含取数、存数、转移等指令在内。在内。MIPS MIPS反映处理能力不够精确(问题反映处理能力不够精确(问题-指令功能等)。指令功能等)。MIPS MIPS只适宜于评估标量机。只适宜于评估标量机。评价方法:评价方法:相对相对MIPS-MIPS-指
23、相对参照机而言的指相对参照机而言的MIPSMIPS:通常用通常用VAX-11/780VAX-11/780机处理能力为机处理能力为1MIPS1MIPS。232 2、MFLOPSMFLOPS指标指标 能够精确反映处理能力(问题能够精确反映处理能力(问题-浮点运算)。浮点运算)。MIPS MIPS比较适宜于评估向量处理机。比较适宜于评估向量处理机。不同操作难度处理:不同操作难度处理:通过正则化方法关联不同的操作。通过正则化方法关联不同的操作。MIPSMIPS与与MFLOPSMFLOPS关系:关系:1MFLOPS3MIPS 1MFLOPS3MIPS。243 3、吞吐率指标、吞吐率指标 定义:定义:单位
24、时间内能处理的作业数。单位时间内能处理的作业数。应用:应用:用于表示并行计算机的并行处理能力的速度。用于表示并行计算机的并行处理能力的速度。对单处理器系统,吞吐率对单处理器系统,吞吐率=1/=1/执行时间。执行时间。提高吞吐率指标方法:提高吞吐率指标方法:流水化:流水化:使多个作业流水处理;使多个作业流水处理;并行处理:并行处理:进行作业分配,给每个进行作业分配,给每个PEPE分配一个作业。分配一个作业。25三、系统响应能力三、系统响应能力 响应能力:响应能力:主要指系统响应时间(输入主要指系统响应时间(输入输出时间)。输出时间)。对单机系统而言,通过响应时间表示。对单机系统而言,通过响应时间
25、表示。响应时间:响应时间:一般只考虑一般只考虑CPUCPU时间(用户时间(用户CPUCPU时间时间+系统系统CPUCPU时时间),进一步只衡量用户间),进一步只衡量用户CPUCPU时间。时间。T=T T=Tusefuluseful+T+Tdatalocaldatalocal 对多处理机而言,通过执行时间表示。对多处理机而言,通过执行时间表示。执行时间:执行时间:需要考虑需要考虑CPUCPU时间(用户时间(用户CPUCPU时间)和通信时间。时间)和通信时间。T=TT=Tuseful(n)useful(n)+T+Tdatalocaldatalocal+T+Th h =T Tusefuluseful
26、/n+T/n+Tdatalocaldatalocal+(T+(Tsynchsynch+T+Tdataremotedataremote+T+Toverheadoverhead)261 1、用户、用户CPUCPU时间时间 TCPU=INCPITC=IN(p+m k)TC 影响用户影响用户CPUCPU时间的因素:时间的因素:系统属性系统属性性能因子性能因子I IN N平均平均CPIT TC Cpmk指令系统结构指令系统结构编译技术编译技术PE实现与控制技术实现与控制技术Cache和内存层次结构和内存层次结构272 2、平均、平均CPICPI n n:指令种类数,:指令种类数,CPICPIi i:第:
27、第i i种指令的种指令的CPICPI,IiIi:第:第i i种指令使用的数量种指令使用的数量 如何提高系统性能?如何提高系统性能?减小平均减小平均CPICPI 减小减小频繁使用(频繁使用(Ii/IN较大较大)指令的指令的CPIi 大概率事件优先原则的应用大概率事件优先原则的应用28 例:例:A A机执行的程序中有机执行的程序中有20%20%转移指令转移指令(2T(2TC C),转移指令都需,转移指令都需要一条比较指令要一条比较指令(1T(1TC C)配合,其他指令配合,其他指令1T1TC C。B B机中转移指令包含机中转移指令包含比较指令,但比较指令,但T TC C比比A A机慢机慢15%15
28、%。A A机、机、B B机哪个工作速度快?机哪个工作速度快?A机:机:TCPUA=INA(0.2 2+0.2 1+0.6 1)TCA =1.2=1.2 INA TCA B机:机:TCPUB=0.8INA(0.2/0.8)2+(1-0.2/0.8)1)1.15TCA =1.15=1.15 INA TCA 结果:结果:B机比机比A机工作速度快。机工作速度快。注意:注意:不能仅按主频衡量系统性能。不能仅按主频衡量系统性能。29四、利用率四、利用率 不直接表示系统性能指标,与前两种指标有密切关系。不直接表示系统性能指标,与前两种指标有密切关系。对系统性能或结构改进与优化起着至关重要的作用。对系统性能或
29、结构改进与优化起着至关重要的作用。例:例:流水线的采用;流水线的采用;Cache Cache的作用;的作用;I/O I/O通道的设计。通道的设计。(定量设计相关原理)(定量设计相关原理)30五、可扩展性五、可扩展性 通过性能可伸缩性评价并行处理能力。通过性能可伸缩性评价并行处理能力。h h:通信时间,通信时间,P P:问题规模,问题规模,n n处理器数量。处理器数量。衡量方法:衡量方法:测量不同测量不同n n时的加速比,构成性能可伸缩性曲线。时的加速比,构成性能可伸缩性曲线。性能可伸缩性:性能可伸缩性:系统性能加速比随处理器数系统性能加速比随处理器数n n增加而线性增长,增加而线性增长,即即
30、S=knS=kn。影响因素:影响因素:结构、处理器数量、问题规模、存储系统等。结构、处理器数量、问题规模、存储系统等。31六、性能评价与比较六、性能评价与比较1 1、评价技术、评价技术(1 1)分析技术)分析技术 思路:思路:在一定假设条件下,计算机系统参数与性能指标参在一定假设条件下,计算机系统参数与性能指标参数之间存在着某种函数关系,按其工作负载的驱动条件列出方数之间存在着某种函数关系,按其工作负载的驱动条件列出方程,用数学方法求解。程,用数学方法求解。发展:发展:从脱离实际的假设发展到近似求解。从脱离实际的假设发展到近似求解。近似求解算法:近似求解算法:聚合法、均值分析法、扩散法等。聚合
31、法、均值分析法、扩散法等。32(2 2)模拟技术)模拟技术 思路:思路:建立模拟器,模拟系统性能模型和工作负载模型,建立模拟器,模拟系统性能模型和工作负载模型,对运行后的数据进行统计分析。对运行后的数据进行统计分析。方法:方法:按被评价系统的运行特性建立按被评价系统的运行特性建立系统模型系统模型;按系统可能有的工作负载特性建立按系统可能有的工作负载特性建立工作负载模型工作负载模型;用语言编写模拟程序,用语言编写模拟程序,模仿模仿被评价系统的被评价系统的运行运行;设计模拟实验,依照评价目标,选择与目标有关因素,设计模拟实验,依照评价目标,选择与目标有关因素,得出实验值,再得出实验值,再进行统计、
32、分析进行统计、分析。33(3 3)测量技术)测量技术 思路:思路:通常采用基准测试程序评估。通常采用基准测试程序评估。基准测试程序:基准测试程序:分为宏基准测试程序和微基准测试程序。分为宏基准测试程序和微基准测试程序。宏基准测试程序:宏基准测试程序:测量系统总体性能,测量系统总体性能,如实际应用程序等;如实际应用程序等;微基准测试程序:微基准测试程序:测量系统某一方面的分离性能,测量系统某一方面的分离性能,如核心程序、合成测试程序等。如核心程序、合成测试程序等。单处理机系统和并行计算机系统的基准测试程序不同。单处理机系统和并行计算机系统的基准测试程序不同。性能测试方法:性能测试方法:选择多组基
33、准测试程序进行测试;选择多组基准测试程序进行测试;对同一基准测试程序进行多次测试结果后求平均。对同一基准测试程序进行多次测试结果后求平均。342 2、测试结果的统计与比较测试结果的统计与比较 目的:目的:对多个系统的相同的多种基准测试程序的测试结果,对多个系统的相同的多种基准测试程序的测试结果,比较不同系统的优劣。比较不同系统的优劣。方法:方法:算术平均、几何平均、调和平均。算术平均、几何平均、调和平均。(1 1)算术平均方法)算术平均方法基准测基准测试程序试程序处理机处理机XYZB120(1.00)10(0.50)40(2.00)B240(1.00)80(2.00)20(0.50)Am(1.
34、00)(1.25)(1.25)基准测基准测试程序试程序处理机处理机XYZB120(2.00)10(1.00)40(4.00)B240(0.50)80(1.00)20(0.25)Am(1.25)(1.00)(2.13)特性:特性:选择不同的参考机,选择不同的参考机,Am结论不同。结论不同。35(2 2)几何平均方法)几何平均方法基准测基准测试程序试程序处理机处理机XYZB120(1.00)10(0.50)40(2.00)B240(1.00)80(2.00)20(0.50)Gm(1.00)(1.00)(1.00)特性:特性:Gm性能与参考计算机性能无关。性能与参考计算机性能无关。依据依据-Gm(X
35、i)/Gm(Yi)=Gm(Xi/Yi)基准测基准测试程序试程序处理机处理机XYZB120(2.00)10(1.00)40(4.00)B240(0.50)80(1.00)20(0.25)Gm(1.00)(1.00)(1.00)36(3 3)调和平均方法)调和平均方法 特性:特性:H Hm m最接近最接近CPUCPU的实际性能。的实际性能。依据依据-H-Hm m与所有测试程序时间总和成反比关系与所有测试程序时间总和成反比关系37第四节第四节 系统结构中并行性的发展系统结构中并行性的发展 一、并行性概念一、并行性概念 并行性并行性包括同时性包括同时性(时刻时刻)和并发性和并发性(时段时段)两个方面。
36、两个方面。并行性等级划分:并行性等级划分:执行程序角度执行程序角度 处理数据角度处理数据角度 信息加工步骤信息加工步骤 指令内指令内 位串字串位串字串 存储器操作并行存储器操作并行 指令间指令间 位并字串位并字串 处理器操作步骤并行处理器操作步骤并行 任务或过程级任务或过程级 位串字并位串字并 处理器操作并行处理器操作并行 作业或程序级作业或程序级 全并行全并行 任务或作业并行任务或作业并行 实现方法:实现方法:时间重叠、资源重复、资源共享。时间重叠、资源重复、资源共享。38二、系统结构树二、系统结构树标量标量顺序的顺序的先行控制先行控制I/E重叠重叠功能并行功能并行多个功能部件多个功能部件流
37、水线流水线隐式向量隐式向量显式向量显式向量存储器到存储器存储器到存储器寄存器到寄存器寄存器到寄存器SIMDMIMD联想处理机联想处理机处理机阵列处理机阵列多计算机多计算机多处理机多处理机39三、并行性发展三、并行性发展1 1、单处理机、单处理机 时间重叠:时间重叠:分离、细化功能部件分离、细化功能部件流水线流水线 功能不同的宏流水线处理机功能不同的宏流水线处理机 异构型多处理机系统异构型多处理机系统 资源重复:资源重复:多操作部件和多体存储器多操作部件和多体存储器 相联、并行(相联、并行(SIMDSIMD)处理机)处理机 同构型多处理机系统同构型多处理机系统 资源共享:资源共享:多道程序、分时
38、多道程序、分时OSOS 真正的处理机代替虚拟机真正的处理机代替虚拟机 分布处理系统分布处理系统402 2、多处理机、多处理机 功能专用化:功能专用化:松耦合系统(通道、共享外围设备)松耦合系统(通道、共享外围设备)专用外围处理机专用外围处理机 专用语言(或功能)处理机专用语言(或功能)处理机 异构型多处理机系统异构型多处理机系统 多机互连:多机互连:紧紧耦合系统(总线、开关互连)耦合系统(总线、开关互连)容错、可重构多处理机容错、可重构多处理机 同构型多处理机系统同构型多处理机系统 网网 络络 化:化:最低耦合系统(存储介质)最低耦合系统(存储介质)通信线路通信线路局域网局域网 分布处理系统分布处理系统41