《2020年计算机体系结构名词解释大全.pdf》由会员分享,可在线阅读,更多相关《2020年计算机体系结构名词解释大全.pdf(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计算机体系结构名词解释大全文档仅供参考,不当之处,请联系改正。名词解释:(1)静态流水线同一时间内,流水线的各段只能按同一种功能的连接方式工作。(2)分段开采当向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,然后循环分段处理,每一次循环只处理一个向量段。(3)计算机体系结构程序员所看到的计算机的属性,即概念性结构与功能特性(4)时间重叠一在并行性中引入时间因素,即多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。(5)TLB个专用高速存储器,用于存放近期经常使用的页表项,其内容是页表部分内容的一个副本(6)结构冲突指某种指令组合因为
2、资源冲突而不能正常执行(7)程序的局部性原理程序在执行时所访问的地址不是随机的,而是相对簇聚;这种簇聚包括指令和数据两部分。(8)2:ICache经验规则大小为N 的直接映象Cache的失效率约等于大小为N/2的两路组相联Cache的实效率。(9)组相联映象主存中的每一块能够放置到Cache中唯一的一组中任何一个地方(10)数据相关当指令在流水线中重叠执行时,流水线有可能改变指令读/写操作的顺序,使得读/写操作顺序不同于它们非流水实现时的顺序,将导致数据相关。(1)动态流水线同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。(2)透明性指在计算机技术中,把原来存在的事物或属性
3、,但从某种角度看又仿佛不存在的特性。(3)层次结构计算机系统能够按语言的功能划分为多级层次结构,每一层以不同的语言为特征。(4)资源共享是一种软件方法,它使多个任务按一定的时间顺序轮流使用同一套硬件设备。(5)快表个专用高速存储器,用于存放近期经常使用的页表项,其内容是页表部分内容的一个副本。(6)控制相关指由分支指令引起的相关,它需要根据分支指令的执行结果来确定后续指令是否执行。存储层次采用不同的技术实现的存储器,处在离CPU不同距离的层次上,目标是达到离CPU最近的存储器的速度,最远的存储器的容量。(8)失效开销CPU向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。(9)全相
4、联映象主存中的任一块能够被放置到Cache中任意一个地方。计算机组成指的是计算机组成的物理实现,包括物理机器中的数据流和控制流的组成以及逻辑软件兼容:同一个软件能够不加修改第运行于体系结构相同的各档及其,而且它们所获得的结文档仅供参考,不当之处,请联系改正。果一样,差别只在于运行时间不同。向后前兼容是指按照某个时期投入市场的某种型号计算机编制的程序,不加修改的就能运行于再她之后前投入市场计算机。向上下兼容:指的是按照某档计算机编制的程序,不加修改就能运行于比她高低的计算机。模拟:是指用软件的方法在一台现有的计算机上实现另一台计算机的指令集。并行性:是指计算机系统在同一时刻或者同一时间间隔内进行
5、多种运算或者操作。只要在实践上互相重叠,就存在并行性,她包含同时性和并发性两种含义同时性:两个或者两个以上的时间在同一时刻发生。并发性:两个或者两个以上的时间在同一时间间隔内发生。提硬并付控的理过程卷时忸资脾挥软怦法,-,便多个任务按一定时询顺序轮流使用同一套设备优o (2)3、诂墓机口界面,即途 径 时 间 重 叠 久 甭 彳 生流重部分一9go(3)系统结构、计算机组成、计算机实现文档仅供参考,不当之处,请联系改正。4存储程序计算机(冯 诺依曼结构)采用存储程序原理,将程序和数据存放在同一存储器中。指令在存储器中按其执行顺序存储,由指令计数器指明每条指令所在的单元地址。1.响应时间从事件开
6、始到结束之间的时间,也称执行时间。2.测试程序用于测试计算机性能的程序,可分为四类:真实程序、核心程序、小测试程序、合成测试程序。3.测试程序组件选择一个各个方面有代表性的测试程序,组成一个通用的测试程序集合。这个通用的测试程序集合称为测试程序组件。4.大概率事件优先此原则是计算机体系结构中最重要和最常见的原则。对于大概率文档仅供参考,不当之处,请联系改正。事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。5.系统加速比系统改进前与改进后总执行时间之比。6.Amdahl定律加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中的所占的重要性。7.程序的局部性原
7、理程序在执行时所访问的地址不是随机的,而是相对簇聚;这种簇聚包括指令和数据两部分。8.CPI指 令 时 钟 数 (Cycles perInstruction)o第二章1 CISC 复杂指令集计算机。RISC 精简指令集计算机。2增 强 CISC指令功能主要是从以下几个方面着手:面向目标程序增强指令功能a增强运算型指令的功能;b 增强数据传送指令的功能;c 增强程序控制指令的功能,丰富的程序控制指令为编程提供了多种选择。1.CISC结构存在的缺点文档仅供参考,不当之处,请联系改正。(1)在 CISC结构的指令系统中,各种指令的使用频率相差悬殊。(2)C ISC 结构指令系统的复杂性带来了计算机体
8、系结构的复杂性,这不但增加了研制时间和成本,而且还容易造成设计错误。CISC结构指令系统的复杂性给VLSI设计增加了很大负担,不利于单片集成。(4)CISC结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。(5)在 CISC结构的指令系统中,由于各条指令的功能不均衡性,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。数据表示:是计算机硬件能够直接识别、指令集能够直接调用的数据类型。所有数据类型中最常见、相对比较简单、用硬件实现比较容易的几种M IPS的寄存器(了解)P43 页M IPS的数据寻址方式有那四种?寄存器寻址、立即数寻址、偏移量寻址、寄存器间接寻址哈弗
9、曼编码方法的计算(1)码长表示法(2)码点表示法2 设计RISC原则选取使用频率最高的指令,并补充一些最有用文档仅供参考,不当之处,请联系改正。的指令;每条指令的功能应尽可能简单,并在一个机器周期内完成;所有指令长度均相同;(4)只有Load和 Store操作指令才访问存储器;其它指令操作均在寄存器之间进行;以简单有效的方式支持高级语言。数据表示:硬件能够直接识别、指令集能够直接调用的数据类型。M I P S 寄存器有32个 64位通用寄存器,提供了单精度和双精度(3 2 位 和 6 4 位)操作的指令;寻址方式:a.立即数寻址b.偏移量寻址c.寄存器间接寻址(0 作偏移量)d.16位绝对寻址
10、(R 0 作基址寄存器);指令格式:I类、R 类、J 类指令第三章1、流水技术是指:将一个重复的时序过程分解成为若干个子过程,而每个子过程都可有效地在其专用功能段上与其它子过程同时执行。流水线实现的五步:取指令、指令编译或寄存器读取、执行或有效地址计算、存储器访问或分支完成、写回2、指令流水线特点:文档仅供参考,不当之处,请联系改正。(1)流水线把一个处理过程分解成若干个子过程,每个子过程由专用的功能段实现;(2)各个功能段所需时间应尽量相等,否则,时间长的功能段将成为流水线的瓶颈,会造成流水线的“堵塞”和“断流”。(3)流水线每个功能部件后面都有一个缓冲寄存器(4)流水技术适合于大量重复的时
11、序过程,只有输入端能连续地提供任务,流水线的效率才能充分发挥。(5)流水线需要有经过时间和排空时间3、流水线中的相关是指相邻或相近的两条指令因存在某种关联相关分类:(1)数据相关(2)名相关,包括反相关和输出相关(输出相关用换名技术来消除)(3)控制冲突 流水线冲突分类及对策:(1)结构冲突(2)数据冲突,包括写后读冲突、写后写冲突和读后写冲突,对策有定向技术、停顿(气泡法)和编译器解决(3)控制冲突,最简单方法冻结或排空4、流水线的分类功能上;单功能流水线;多功能流水线同一时段各段之间联系(对多功能来说):静态流水线、动态流水线;文档仅供参考,不当之处,请联系改正。级别上:部件级流水线、处理
12、机级流水线、处理机间流水线;(4)按是否有反馈回路:线性流水线、非线性流水线;按任务流入和流出顺序是否相同:顺序流水线、乱序流水线;5,吞吐率是指单位时间内流水线所完成的任务数或输出结果的数量。最大吞吐率是指流水线在连续流动达到稳定状态后所得到的吞吐率。第 五 章存储层次1、cache降低失效率的几种方法增加块大小、提高相联度、victim cache伪 相 联cache、硬件预存、编译器控制的预存、编译器优化2、子块放置技术:把Cache块进一步划分为更小的块(子块),并给每个子块赋予一位有效位,用于指明该子块中的数据是否有效。Cache与下一级存储器之间以子块为单位传送数据。但标识仍以块为
13、单位4、减少失效开销技术让读失效优先于写子块放置技术请求字处理技术非阻塞Cache技术采用两级Cache文档仅供参考,不当之处,请联系改正。5、请求字优先:调块时,从请求字所在的位置读起。这样,第一个读出的字便是请求字。将之立即发送给CPU从执行程序的角度来看,并行性等级从低到高可分为:(1)指令内部并行:单条指令中各微操作之间的并行。(2)指令级并行:并行执行两条或两条以上的指令。(3)线程级并行:并行执行两个或两个以上的线程。一般是以一个进程内派生的多个线程为调度单位。(4)任务级或过程级并行:并行执行两个或两个以上的过程或任务(程序段)以子程序或进程为调度单元。(5)作业或程序级并行:并
14、行执行两个或两个以上的作业或程序。1.存储器层次结构设计技术的基本依据是程序的局部性原理,它包含时间局部性和空间局部性两方面。2.伪相联既能获得多路组相联cache的命中率,又能保持直 接 映 像 cache的命中速度。3.C P U 中用来存储操作数的存储单元主要有寄存器、堆栈和累加器。4.将计算机系统中某一功能的处理速度提高到原来的20倍,但该系统的处理时间仅占整个系统运行时间的4 0%,则采用此提高性能的方法后,能使整个系统的性能提高到原来的 1.61 倍。文档仅供参考,不当之处,请联系改正。5.虚拟存储器采用 全相联 映像规则,写策略采用 写回策略。1.计算机系统的多层结构从高到低能够
15、分为应用语言虚拟机 高级语言虚拟机,汇编语言虚拟机,操作系统机器级,传统机器级 和 微程序机器级。2.并行性包含 同时性 和 并发性 二重含义。3 .系列机软件必须保证向后 兼容。4.某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行某一程序的整体性能提高到原来的5 倍,则该程序中浮点操作所占的比例是 84.2%。系统加速比是 5。5.由软件实现的机器称为虚拟机.在一个计算机系统中,低层机器的属性对高层机器的程序员往往是的 透明的。集中式共享存储器结构(centralized shared memory architecture):这类多处理机在当前至多有几十个处理器
16、,可经过大容量的cache和总线互连使各处理器共享一个单独的集中式存储器。物理上分离的多个存储器可作为一个逻辑上共享的存储空间进行编址,每个处理器能够访问任何一个其它的局部存储器。这类机器的结构被称为分布式共享存储器(DSM,distributedshared memory)或可缩放共享存储器(SSM,scalable shared memory)体系结构。整个地址空间由多个独立的地址空间构成,它们在逻辑上也是独立的,远程的处理器不能对其直接寻址。在这种机器的不同处理器中,相同的物理地址指向不同存储器的不同单元,每一个文档仅供参考,不当之处,请联系改正。处理器、存储器模块实际上是一个单独的计算
17、机,因 而 这 种 机 器 也 称 为 多 计 算 机(multicomputers)。通讯延迟:发送开销+跨越时间+传输延迟+接收开销。迁移是把远程的共享数据项的拷贝放在一个本处理器局部的cache中使用,从而可降低对远程共享数据的访问延迟。复制是把多个处理器需要同时读取的共享数据项的拷贝放在各自局部cache中使用,复制不但降低了访存的延迟,也减少了访问共享数据时的产生的冲突。目 录(directory):物理存储器中用来保存共享数据块的状态及相关信息的数据结构。监 听(snooping):每 个cache除了包含物理存储器中块的数据拷贝外,也保存着各个块的共享状态信息。Cache 一般连
18、在共享存储器的总线上,各个cache控制器经过监听总线来判断它们是否有总线请求的数据块。在一个处理器写某个数据项之前保证它对此数据项有唯一的访问权,对应这种方法的协议称为写作废(write invalidate)协议。cache块文档仅供参考,不当之处,请联系改正。拥有唯一的拷贝的处理器一般称为这个cache块的拥有者(ower)o处理器的写操作使其成为对应cache块的拥有者。原 子 性(atom ic),即操作运行过程中不能被打断,例如将写失效的检测、申请总线连接、接收响应作为一个单独的原子操作。基于目录的相关性协议称为全映射(full map)o原子交换(atomic change):将
19、一个存储单元的值和一个寄存器的值进行交换。建立一个锁,锁值为0表示开锁,为1表示上锁。旋转锁是指处理器环绕一个锁不停地旋转而试图获得该锁。栅 栏(barrier)同步:是一个同步操作,它强制所有到达该栅栏的进程进行等待,直到全部的进程到达栅栏,然后释放全部的进程,从而形成同步。组合树是多个请求在局部结合起来形成树的一种分级结构,它降低冲突的原因是将大冲突化解成为并行的多个小冲突。排队记录等待的进程,当锁释放时送出一个已确定的等待进程,这种机制称为排队锁(queuing lock)o 一个处理器对变量的写和另一个处理器对该变量的访问(读文档仅供参考,不当之处,请联系改正。或写)由一对同步操作分开
20、,其中一个在写操作后执行,另一个在别的处理机访问之前执行,则称数据访问有序。无同步操作排序变量可能提前被刷新,这种情况称为数据竞争(data race),从而对于同步的程序可称之为无数据竞争(datarace-free)。称与解锁相对应的同步操作为释放(release)与加锁相对应的则称为获取(acquire)o防护(fence)是计算过程中的固定点,用来保证无读或写穿过防护点。预取能返回最新数据值,而且保证对数据实际的存储器访问返回的是最新的数据项,则被称为非绑定的(nonbinding)。互连网络是将集中式系统或分布式系统中的结点连接起来所构成的网络,这些结点可能是处理器、存储模块或其它设
21、备,它们经过互连网络进行信息交换。静态网络由点和点直接相连而成,这种连接方式在程序执行过程中不会改变。动态网络是用开关通道实现的,它可动态地改变结构,使其与用户程序中通信要求匹配。与结点相连接的边的数目称为结点度(nodedegree)。链路或通路是指网络中连接两个结点并传文档仅供参考,不当之处,请联系改正。送数字信号的通路。在单向通道的情况下,进入结点的通道数叫做入度(in degree),而从结点出来的通道数则称为出度(out degree),结点度是这两点之和。结点度应尽可能地小并保持恒定。网络中任意两个结点间最短路径长度的最大值称为网络直径。网络直径应当尽可能地小。在将某一网络切成相等
22、两半的各种切法中,沿 切 口 的 最 小 通 道 边 数 称 为 通 道 等 分 宽 度(channel bisection width)o 对于一个网络,如果从其中的任何一个结点看,拓朴结构都是一样的话,则称此网络为对称网络。计算/通讯比:是衡量并行程序性能的尺度,是应用程序中相对于每次数据通信需要进行的计算。路 由(routing):在网络通信中对路径的选择与指定。置 换(permutation):指对象的重新排序。虫 蚀(wormhole):把包进一步分成小片,硬件路由器有片缓冲区,同一个包中所有片象不可分离的同伴一样,以流水方式顺序传送。只有片头包含目标地址,所有片必须跟随片头。存储转
23、发:是指每个结点有一个包缓冲区,文档仅供参考,不当之处,请联系改正。包先进入缓冲区,当所需要的输出通道和接收结点的包缓冲区可用时,就将它传输给下一结点。维序:按多维网络维序的特定顺序来选择后续通道。由于唯一性,可能产生死锁。虚拟自适应:将一个物理通道分成几个虚拟的通道,根据后续各虚拟通道的忙闲情况自适应选择后续通道。线性阵列(linear array):是一种一维的线性网络,其中n个结点用111个链路连成一行。如果多级网络经过重新安排连接方式能够建立所有可能的输入输出之间的连接,则称之为非阻塞 网 络(nonblocking network)。粗粒度:每台处理机所执行的程序为20秒以上,共享主
24、存。中粒度:每台处理机所执行的程序为10毫秒以上,消息传递。细粒度:并行性高,在几个微秒量级,但通信开销大。指 令 级 并 行(instruction level parallelismILP):指令序列中存在的潜在并行性。循环级并行:循环体指令之间的并行性。指令调度:经过改变指令在程序中的位置,文档仅供参考,不当之处,请联系改正。将相关指令之间的距离加入到不小于指令执行延迟的时钟数,这样就能够将相关指令转化为实际上无关指令。循环展开:经过多次复制循环体并改变结束条件来相对增加有效操作时间。名相关:如果两条指令使用相同的名,可是它们之间并没有数据流。包括反相关和输出相关。指令使用的寄存器或存储
25、器称为名。反相关:指令i先执行,指令j 写的名是指令 i读的名。W A R输出相关:指令j与指令i写的名相同。W A W重命名技术:经过改变指令中操作数的名来消除名相关。控制相关:是指分支指令引起的相关。动态调度:经过硬件重新安排指令的执行顺序,来调整相关指令实际执行的关系,减少处理器的空转。记 分 牌(scoreboarding):指令运行所需的资源满足而且没有数据相关,允许指令乱序执行,并同时记录指令运行状态的技术。寄存器重命名:一条指令流出时,存放操作数的寄存器被重命名为对应于该存储器保留站文档仅供参考,不当之处,请联系改正。的名称(编号)的过程。动态分支预测:一种给予历史记录的分支预测
26、,它解决记录一个分支指令的历史和决定预测的分支的一个问题的两个方面。分支目标缓冲(PTB):将分支成功的分支指令的地址和它的分支目标地址都放到一个缓冲中保存起来,缓冲区分支指令的地址作为标示。前 瞻(speculation)执行:允许在处理器还未判断指令是否能执行之前就提前执行,以克服控制相关。保留站:用于保存等待流出和正在流出的指令所需的操作数。再定序缓冲:在前瞻执行的指令之间传送结果的一套额外的硬件缓冲,保存指令执行完毕到指令得到确认之间的所有指令及结果。超 标 量(superscalar):每个时钟流出的指令不定。超 流 水(super pipeling):是指每个功能部件进一步流水化,
27、使得一个功能部件在一拍中能够处理多条指令。超长指令字 VLIW(very long instructionword):每个时钟周期流出的指令数是固定的,文档仅供参考,不当之处,请联系改正。它们构成一条长指令,或者是一个混合的指令包。DLX标量:每个时钟流出两条指令。The compiler technique to create sdditionalinstruction-level parallelism for a loop is simplycalled loop unrolling.The hardware technique to createadditional instructi
28、on-level parallism for a loopis simply called register renaming.Reservation stations:buffers holdinstructions and operands that have been issuedand are awaiting execution at a functional unit.A recurrence is when a variable is definedbased on the value of that variable in an earlieriteration,often t
29、he one immediately preceeding,as in the above fragmentAs an example,a simple and sufficient testfor the absence of a dependence is the greatestcommon divisor(GCD)test.软件流水:是一项重构造相互重叠进行的软件流水性代码的循环,使其指令从原始的循环中的不同重复中选取的技术。路径调度是用一项经过不同于循环分支的文档仅供参考,不当之处,请联系改正。条件分支发觉并行的技术,扩展可循环展开。路径:试图去发觉一个可能的其操作将被放入一个小数目
30、的指令集基本程序块的顺序称为路 径(trace),须子此路径称为路径选择(traceselection)。路径精简:试图去精简路径到一个小数目的广泛的指令集的过程(trace compaction)a set of status,called poison bits,areattached to the result registers written byspeculated instructions when the instructionscause exceptions.An alternative is to move instructions pastbranches,flaggi
31、ng them as speculative,andproviding renaming and buffering in thehardware,much as Tomasulos algorithm does.This concept has been called boosting(推 进).Adding this commit phase to the instructionexecution sequence requires some changes to thesequence as well as an additional hardwarebuffer,called the
32、reorder buffer,to hold theresults of instructions that have finishedexecution but have not committed.文档仅供参考,不当之处,请联系改正。3.1 术语1.流水线:将一个重复的时序过程,分解为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。2.单功能流水线:只能完成一种固定功能的流水线。3.多功能流水线:流水线的各段能够进行不同的连接,从而使流水线在不同的时间,或者在同一时间完成不同的功能。4静态流水线:同一时间内,流水线的各段只能按同一种功能的连接方式工作。5.动态流
33、水线:同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。6.部件级流水线:(运算操作流水线)把处理机的算术逻辑部件分段,以便为各种数据类型进行流水操作。7.处理机型流水线:(指令流水线)把解释指令的过程按照流水方式处理。8.处理机间流水线:(宏流水线)由两个以上的文档仅供参考,不当之处,请联系改正。处理机串行地对同一数据流进行处理,每一个处理机完成一项任务。9.线形流水线:指流水线的各段串行连接,没有反馈回路。10.非线形流水线:指流水线中除有串行连接的通路外,还有反馈回路。11.标量流水处理机:处理机不具有向量数据表示,仅对标量数据进行流水处理。12.向量流水处理机:处理机
34、具有向量数据表示,并经过向量指令对向量的各元素进行处理。13.结构相关:某些指令组合在流水线中重叠执行时,长生资源冲突,则称该流水线有结构相关。14.数据相关:当指令在流水线中重叠执行时,流水线有可能改变指令读/写操作的顺序,使得读/写操作顺序不同于它们非流水实现时的顺序,将导致数据相关。15.定向:将计算结果从其产生的地方直接送到其它指令需要它的地方,或所有需要它的功能单元,避免暂停。两条指令ij,i在 j前进入流水线。16.RAW:j执行要用到i的结果,但当其在流水文档仅供参考,不当之处,请联系改正。线中重叠执行时,j 可能在I 写入其结果之前就先行对保存该结果的寄存器进行读操作,得到错误
35、值。17.W A W:j、I 的操作数一样,在流水线中重叠执行时,j 可能在I 写入其结果之前就先行对保存该结果的寄存器进行写操作,导致写错误。18.W A R:j 可能在I读某个寄存器之前对该寄存器进行写操作,导致I读出数据错误。3.2答:1.流水过程由多个相联系的子过程组成。2.每个子过程由专用的功能段实现。3.各个功能段所需时间尽量相等。4.流水线有“经过时间”(第一个任务流出结果所需的时间)。在此之后流水过程才进入稳定工作状态,一拍流出一个结果。5.流水技术适合于大量重复的时序过程,只有输入端连续提供任务,流水线效率才可充分发挥。文档仅供参考,不当之处,请联系改正。3.3答:工作原理:
36、把一条DL X指令在5个周期内实现,将每一个时钟周期看作是流水线的一个时钟周期,硬件每个时钟周期启动一条新的指令,并执行5条不同指令中的某一部分。每条指令虽仍需5个时钟周期完成,但提高了吞吐率,实现了流水。instrJclock 1 2 3 4 5 6 7 8 9I IF ID EX MEM WB1+1 IF ID EX MEM WB1+2 IF ID EX MEM WB1+3 IF ID EX ME WBM1+4 IF ID EX MEM WB3.4答:指令多周期实现能够降低时钟周期时间,单周期实现则可降低C P L同时延长时钟周期。单周期实现能够省去一些临时寄存器,可是对多数机器而言,单周
37、期实现并非十分有效,因为不同指令完成的操作与所需时钟周期时间都不同。单周期实现必须重复设置指令执行功能部件,多周期实现可采用流水技术共享功能单元。文档仅供参考,不当之处,请联系改正。3.5答:(1)流水化功能单元(2)资源重复3.6 解:(1)在流水线中尽早判断出分支转移是否成功;(2)尽早计算出分支转移成功时的P C值(即分支的目标地址)“冻结”“排空”流水线的方法 预测分支失败 预测分支成功 延迟分支3.7答:1、从前调动:分支必须不倚赖于被调度的指令,总是能够有效提高流水线性能。2、从目标处调度:若分支转移失败,必须保证被调度的指令对程序的执行没有影响,可能需要复制被调度指令。分支转移成
38、功时,可提高流水线性能。但由于文档仅供参考,不当之处,请联系改正。复制指令,可能加大程序空间。3、从失败处调度:若分支转移成功,必须保证被调度的指令对程序的执行无影响。分支转移失败时,可提高流水线性能。3.8 答:1、水平处理方式:若向量长度为N,则水平处理方式相当于执行N 次循环。若使用流水线,在每次循环中可能出现数据相关和功能转换,不适合对向量进行流水处理。2、垂直处理方式:将整个向量按相同的运算处理完毕之后,再去执行其它运算。适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入、输出端直接与存储器相联,构成MM型的运算流水线。3、分组处理方式:把长度为N的向量分为若干组,每组长度为n,组内按纵向方式处理,依次处理各组,组数为文档仅供参考,不当之处,请联系改正。目,适合流水处理。可设长度为n的向n量寄存器,使每组向量运算的源/目向量都在向量寄存器中,流水线的运算部件输入、输出端与向量寄存器相联,构成R-R型运算流水线。