《计算机系统结构张晨曦版课后答案解析.docx》由会员分享,可在线阅读,更多相关《计算机系统结构张晨曦版课后答案解析.docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 计算机系统结构张晨曦版课后答案解析 3.1 -3.3为术语解释等解答题。 3.4 设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为T, T, 2T,分别求出以下各种状况下,连续执行N条指令所需的时间。 (1) 挨次执行方式 (2) 只有“取指令”与“执行指令”重叠 (3) “取指令”,“分析指令”与“执行指令”重叠 解: (1) 4NT (2) (3N+1) T (3) 2(N+1) T 3.6 解决流水线瓶颈问题有哪两种常用方法? 解: (1) 细分瓶颈段 将瓶颈段细分为若干个子瓶颈段 (2) 重复设置瓶颈段 重复设置瓶颈段,使之并行工作,以此错开处理任务
2、 3.9 列举下面循环中的全部相关,包括输出相关,反相关,真数据相关。 for(i = 2; i 100; i=i+1) ai = bi + ai;-(1) ci+1 = ai + di;-(2) ai-1 = 2*bi; -(3) bi+1 = 2*bi; -(4) 解: 输出相关:第k次循环时(1)与第k+1轮时(3) 反相关:第k次循环时(1)和(2)与第k-1轮时(3) 真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4) 3.12 有一指令流水线如下所示 50ns 50ns100ns 200ns (1) 求连续如入10条指令的状况下,该流水线的实际
3、吞吐率和效率 (2) 该流水线的“瓶颈”在哪一段?请采纳两种不同的措施消退此“瓶颈”。对于你所给出 的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)(m表示流水线级数,n 表示任务数) (2)瓶颈在 3、4段。 方法一:变成八级流水线(细分) 11.7e8 方法二:变成两级流水线(合并) 方法三:将段 1、2 合并为一段,段 4 细化流水为两段 方法四:重复设置部件,设置 2个部件 3,4个部件 4,和第一种方法结果一样 3.14 有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3段时间为2t,其余各段时间均为t,而且流水线的输出可
4、以直接返回输入端或暂存于相应的流水存放器中,现要在该流水线上计算 (AB),画出其时空图,并计算其吞吐率、 i i i1 4 急速比和效率。 解:(1).任务划分如下: F = ( A1 + B1 )( A 2 + B2 )( A3+ B3 )( A4+ B4 ) (7) 时空图如下: S5S4S3S2S1 (2) Tk = 18t,TP = 7/18t,S = 29/18=1.611,E = 29/(18*5)=29/9032.2% 3.15 一动态多功能流水线由6个功能段组成,如下列图(图4): 图4 其中:S1、S4、S5、S6组成乘法流水线,S1、S2、S3、S6组成加法流水线,每个功
5、能段时间均为50ns。假定该流水线的输出结果可以直接返回流水线输入端,而且设置有足够 的缓冲存放器。若根据最快的方式用该流水线计算 请画出其处理过程的时空图。 计算其实际吞吐率,加速比和效率。 解:(1).任务划分如下: 。 F = X1Y1Z1 + X2Y2Z2 + X3Y3Z3 + X4Y4Z4 + X5Y5Z5 时空图如下: S6S5S4S3S2 S1 (2).Tk = 22t,TP = 7/11t=7/(11*50ns)=12.727e6,S = 28/11=2.555,E = 14/33=42.42% 3.18、在Cray 1机上,按链接方式执行下面4条向量指令(括号中给出相应功能部
6、件时间),假如向量存放器和功能部件之间的数据传输需要1拍,试求此链接流水线的流过时间为多少拍?假如向量长度为64,则需要多少拍能得到全部结果。 V0存储器 (存储器取数:7拍) V2V0+V1 (向量加:3拍)V3V2A3 (根据A3左移:4拍)V5V3V4 (向量规律乘:2拍) 解答: 四条指令每前后两条依次存在先写后读相关,故流水线经过时间为(1+7+1) + (1+3+1) + (1+4+1) + (1+2+1) = 24。 假如向量长度为64,则需24 + (64-1) = 87拍能得到全部结果。 篇三:计算机体系构造课后习题原版答案_张晨曦著 1.1 解释以下术语 计算机系统构造:传
7、统机器程序员所看到的计算机属性,即概念性构造与功能特性。 计算机组成:计算机系统构造的规律实现,包含物理机器级中的数据流和掌握流的组成以及规律设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理构造,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某局部进展改良时,改良后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进展改良后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 并行性:计算机系统在同一时刻或者同一时间间隔内进展多种运算或操作。只要在时间上相互重叠,就存在
8、并行性。它包括同时性与并发性两种含义。 1.2 试用实例说明计算机系统构造、计算机组成与计算机实现之间的相互关系。 答:如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统构造。确定主存周期、规律上是否采纳并行主存、规律设计等属于计算机组成。选择存储芯片类型、微组装技术、线路设计等属于计算机实现。 计算机组成是计算机系统构造的规律实现。计算机实现是计算机组成的物理实现。一种体系构造可以有多种组成。一种组成可以有多种实现。 1.4 计算机系统设计中常常使用的4个定量原理是什么?并说出它们的含义。 答:(1)以常常性大事为重点。在计算机系统的设计中,对常常发生的状况,给予它优先的处
9、理权和资源使用权,以得到更多的总体上的改良。(2)Amdahl定律。加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。(3)CPU性能公式。执行一个程序所需的CPU时间 = IC CPI 时钟周期时间。(4)程序的局部性原理。程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。 1.6 某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下: 求该计算机的有效CPI、MIPS和程序执行时间。 解:(1)CPI (4500017500028000415002) / 1295001.776 (2)MIPS速率f/ CPI 400/
10、1.776 225.225MIPS (3)程序执行时间= (4500017500028000415002)400=575s 1.7 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采纳此增加功能方法后,能使整个系统的性能提高多少? 解 由题可知:可改良比例 = 40% = 0.4部件加速比 = 10 依据Amdahl定律可知: 1 系统加速比1.5625 0.4 10.4 10 采纳此增加功能方法后,能使整个系统的性能提高到原来的1.5625倍。 1.8 计算机系统中有三个部件可以改良,这三个部件的部件加速比为: 部件加速比1=30;部件加速比2=
11、20; 部件加速比3=10 (1) 假如部件1和部件2的可改良比例均为30%,那么当部件3的可改良比例为多少时,系统加速比才可以到达10? (2) 假如三个部件的可改良比例分别为30%、30%和20%,三个部件同时改良,那么系统中不行加速局部的执行时间在总执行时间中占的比例是多少? 解:(1)在多个部件可改良状况下,Amdahl定理的扩展: Sn (1 1 Fi) Fi Si 已知S130,S220,S310,Sn10,F10.3,F20.3,得: 10 1 1(-0.30.3F3)(0.3/300.3/20F3/10) 得F30.36,即部件3的可改良比例为36%。 (2)设系统改良前的执行
12、时间为T,则3个部件改良前的执行时间为:(0.3+0.3+0.2)T = 0.8T,不行改良局部的执行时间为0.2T。 已知3个部件改良后的加速比分别为S130,S220,S310,因此3个部件改良后的执行时间为: Tn 0.3T0.3T0.2T 0.045T 302023 改良后整个系统的执行时间为:Tn = 0.045T+0.2T = 0.245T 那么系统中不行改良局部的执行时间在总执行时间中占的比例是: 0.2T 0.82 0.245T 1.9 假设某应用程序中有4类操作,通过改良,各操作获得不同的性能提高。详细数据如下表所示: (2)各类操作单独改良后,程序获得的加速比分别是多少?
13、(3)4类操作均改良后,整个程序的加速比是多少? 解:依据Amdahl定律Sn1Fe (1Fe) Se 可得 4类操作均改良后,整个程序的加速比: 1 Sn2.16 Fi (1Fi)Si 第2章 指令集构造的分类 2.1 解释以下术语 堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。 通用存放器型机器:CPU 中存储操作数的单元是通用存放器的机器。 2.2 区分不同指令集构造的主要因素是什么?依据这个主要因素可将指令集构造分为哪3类? 答:区分不同指令集构造的主要因素是CPU中用来存储操作数的存储单元。据此可将指令系统构造分为堆栈构
14、造、累加器构造和通用存放器构造。 2.4指令集应满意哪几个根本要求? 答:对指令集的根本要求是:完整性、规整性、高效率和兼容性。 完整性是指在一个有限可用的存储空间内,对于任何可解的问题,编制计算程序时,指令集所供应的指令足够使用。 规整性主要包括对称性和匀称性。对称性是指全部与指令集有关的存储单元的使用、操作码的设置等都是对称的。匀称性是指对于各种不同的操作数类型、字长、操作种类和数据存储单元,指令的设置都要同等对待。 高效率是指指令的执行速度快、使用频度高。 2.7简述RISC指令集构造的设计原则。 答(1) 选取使用频率最高的指令,并补充一些最有用的指令;(2)每条指令的功能应 尽可能简
15、洁,并在一个机器周期内完成;(3)全部指令长度均一样;(4)只有Load和Store操作指令才访问存储器,其它指令操作均在存放器之间进展; (5) 以简洁有效的方式支持高级语言。 2.10通常有哪几种指令格式,请简述其适用范围。 答: (1) 变长编码格式。假如系统构造设计者感兴趣的是程序的目标代码大小,而不是性能,就可以采纳变长编码格式。(2)固定长度编码格式。假如感兴趣的是性能,而不是程序的目标代码大小,则可以选择固定长度编码格式。 (3) 混合型编码格式。需要兼顾降低目标代码长度和降低译码简单度时,可以采纳混合型编码格式。 第3章 流水线技术 3.1解释以下术语 流水线:将一个重复的时序
16、过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。 吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。 流水线的加速比:使用挨次处理方式处理一批任务所用的时间与按流水处理方式处理同一批任务所用的时间之比。 数据相关:考虑两条指令i和j,i在j的前面,假如下述条件之一成立,则称指令j与指令i数据相关: (1)指令j使用指令i产生的结果; (2)指令j与指令k数据相关,而指令k又与指令i数据相关。 数据冲突:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突。 定向:用来解决写后读冲突的。在发生写后读相关的状况下,在计算结果尚未出
17、来之前,后面等待使用该结果的指令并不见得是立刻就要用该结果。假如能够将该计算结果从其产生的地方直接送到其它指令需要它的地方,那么就可以避开停顿。 链接技术:具有先写后读相关的两条指令,在不消失功能部件冲突和Vi冲突的状况下,可以把功能部件链接起来进展流水处理,以到达加快执行的目的。 分段开采:当向量的长度大于向量存放器的长度时,必需把长向量分成长度固定的段,然后循环分段处理,每一次循环只处理一个向量段。 3.3 简述先行掌握的根本思想。 答:先行掌握技术是把缓冲技术和预处理技术相结合。缓冲技术是在工作速度不固定的两个功能部件之间设置缓冲器,用以平滑它们的工作。预处理技术是指预取指令、对指令进展
18、加工以及预取操作数等。 采纳先行掌握方式的处理机内部设置多个缓冲站,用于平滑主存、指令分析部件、运算器三者之间的工作。这样不仅使它们都能独立地工作,充分劳碌而不用相互等待,而且使指令分析部件和运算器分别能快速地取得指令和操作数,大幅度地提高指令的执行速度和部件 的效率。这些缓冲站都按先进先出的方式工作,而且都是由一组若干个能快速访问的存储单元和相关的掌握规律组成。 采纳先行掌握技术可以实现多条指令的重叠解释执行。 3.4 设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段,每个阶段所需的时间分别为t、t和2t 。分别求出以下各种状况下,连续执行N条指令所需的时间。 (1)挨次执行方式;
19、 (2)只有“取指令”与“执行指令”重叠; (3)“取指令”、“分析指令”与“执行指令”重叠。 解:(1)每条指令的执行时间为:tt2t4t 连续执行N条指令所需的时间为:4Nt (2)连续执行N条指令所需的时间为:4t3(N-1)t(3N1)t (3)连续执行N条指令所需的时间为:4t2(N-1)t(2N2)t 3.5 简述流水线技术的特点。 答:流水技术有以下特点: (1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个特地的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。 (2) 流水线中各段的时间应尽可能相
20、等,否则将引起流水线堵塞和断流。 (3) 流水线每一个功能部件的前面都要有一个缓冲存放器,称为流水存放器。 (4) 流水技术适合于大量重复的时序过程,只有在输入端不断地供应任务,才能充分发挥流水线的效率。 (5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 3.6 解决流水线瓶颈问题有哪两种常用方法? 答:细分瓶颈段与重复设置瓶颈段 3.10 简述三种向量处理方式,它们对向量处理机的构造要求有何不同? 答 (1)横向处理方式:若向量长度为N,则水平处理方式相当于执行N次循环。若使用流水线,在每次循环中可能消失数据相关和功能转换,不适合对向量进展流水处理。 (2)
21、纵向处理方式:将整个向量按一样的运算处理完毕之后,再去执行其他运算。适合对向量进展流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入、输出端直接与存储器相联,构成M-M型的运算流水线。 (3)纵横处理方式:把长度为N的向量分为若干组,每组长度为n,组内按纵向方式处理,依次处理各组,组数为N/n,适合流水处理。可设长度为n的向量存放器,使每组向量运算的源/目向量都在向量存放器中,流水线的运算部件输入、输出端与向量存放器相联,构成R-R型运算流水线。 3.11 可采纳哪些方法来提高向量处理机的性能? 答:可采纳多种方法: (1) 设置多个功能部件,使它们并行工作; (2) 采纳链接技术,加快一串向量指令的执行;