《2022年系统结构复习资料.docx》由会员分享,可在线阅读,更多相关《2022年系统结构复习资料.docx(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思考试题型 一、单项挑选题(每题 2 分,共 26 分)二、填空题(每空 0.5 分,共 7 分)三、大题(共 67 分)共 5 个,有概念题、分析题、运算题、设计题、综合题复习提纲 大题的复习范畴:1. 会利用 CPU 性能公式比较多种设计方案的优劣 公式一:CPU 时间 = 一个程序的 CPU 时钟周期数 * 时钟周期长度 或: CPU 时间 = 一个程序的 CPU 时钟周期数 /时钟频率 公式二:CPU 时间 = IC*CPI* 时钟周期长度 公式三:2. 会利用 Amdahl 定律比较多种设计方案的优
2、劣 Amdahl 定律:运算机系统中某一部件由于采纳某种更快的执行方式后整个系统 性能的提高与这种执行方式的使用频率或占总执行时间的比例有关;名师归纳总结 - - - - - - -第 1 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思3.Cache的性能分析,会针对详细情形分析Cache的性能CPU 执行时间:CPU执行时间CPU时钟周期数储备器停顿周期数时钟周期时间缺失代价储备器停顿周期数缺失次数缺失代价指令数缺失次数缺失代价指令指令数储备器拜访次数缺失率指令平均储备器拜访时间( AMAT ):AMATHT Cache 1HT 主存
3、命中时间缺失率缺失代价提高 Cache 性能:可见主要途径有:降低缺失代价降低缺失率通过并行性降低缺失代价 /缺失率降低 Cache 命中时间4. 导致 Cache失效的缘由,需进一步把握如何降低这三类失效的方法 缘由:(1)强制( Compulsory)缺失:对一个块的第一次拜访肯定不在 Cache中,所 以该块必需被调入到 Cache中(这也称为:冷启动缺失、首次拜访缺失等);(2)容量(Capacity)缺失:假如 Cache容纳不了一个程序连续执行所需要的所 有块,将会发生容量缺失,某些块将被舍弃,随后再被调入;(3)冲突(Conflict )缺失:假如采纳组相联 /直接相联,就可能有
4、多个块映射到 同一块中,发生冲突缺失;降低缺失率的技术:(1)增加 Cache块大小(2)增加 Cache容量(3)增加相联度名师归纳总结 - - - - - - -第 2 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思(4)路猜测和伪相联 Cache (5)编译优化5. 向量链接技术基本思想:对于有写读数据相关的向量指令,可以采纳“ 相关专用通道”:从一个流水线部件得到的结果直接送入另一个流水线部件的操作数寄存器,以并行执行,这种技术称为流水线的链接技术;链接要求:1.没有向量寄存器冲突和运算部件冲突;这样多条向量指令可2.只有当前一
5、条指令的第一个结果重量送入结果向量寄存器的那一个时钟周期 方可链接,否就只能串行执行;3.如一条向量指令的两个源操作数分别是两条先行指令的结果时,要求:先行的两条指令产生结果的时间必需相等;先行的两条指令的向量长度必需相等;6. 静态多功能流水线和动态多功能流水线的调度 动态调度算法: Tomasulo算法7. Delta 互连网络的设计,依据方法即可设计名师归纳总结 - - - - - - -第 3 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思8. 多级交叉开关互连网络的设计,需把握其基本原理方可进行设计9. 循环中的指令调度技术:
6、调度、循环绽开、软件流水(重点把握)第四章 205 页其它题的复习范畴:1. 衡量机器性能的唯独固定而且牢靠的标准是什么?真实程序的执行时间;2. 并行性的常用实现技术,并结合本课程的内容进行举例(1)时间重叠:指令流水线(2)资源重叠:N 模冗余结构 多处理机 多值储备器(3)资源共享:多道程序分时系统3. 设计运算机系统设计的常用的定量准就(1)加快常常性大事的速度(2)CPU 性能公式(3)局部性原理(4)利用并行性4. 实现软件可移植的主要途径有哪些?(1)统一高级语言: 设计出一种完全通用的高级语言, 为全部的程序员所使用;(2)采纳系列机思想:先确定好系统结构,软件设计者据此设计软
7、件,硬件设计者就依据不同的性能要求, 采纳不同的组成和实现技术, 供应不同档次的机器;软件兼容性:软件兼容性指的是同一软件可不加修改地运 各档机器上的特性;(3)模拟与仿真:模拟( simulation simulation)指的是用一台机器(宿主机行于该系列机器中的宿主机)的机器语言名师归纳总结 程序说明实现另一台机器(虚拟机虚拟机)的指令系统的方法;第 4 页,共 13 页- - - - - - -精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思仿真( emulation emulation)指的是用一台机器(宿主机 实现另一台机器(目标机 目标机)
8、的指令系统的方法;5. Flynn 分类法宿主机)的微程序说明名师归纳总结 - - - - - - -第 5 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思6. 什么是数据表示?什么是数据结构?数据表示: 能由硬件直接识别和引用 (即有相应运算指令和有硬件支持)的数据 类型,例如:定点数据表示、规律数据表示、浮点数据表示等;数据结构:带有结构的数据元素的集合,例如:串、队列、栈、向量、阵列、链表、树、图等;7. 扩展编码的编码原理思想:是固定长度操作码和Huffman 编码法相结合形成的;即:对Huffman 编码,依据使用频率宏观分布
9、,将编码长度扩展成有限几种长度的编码;8.RISC 执行程序的速度比CISC 要快的关键缘由是什么?削减指令平均执行周期;(1)硬件为主固件为辅(2)在 CPU 中设置数量较大的寄存器组(3)指令的执行采纳流水(4)采纳仔细设计和优化编译系统设计的技术9. RISC 的特点 优点:简化指令系统设计,适合 VLSI 实现;提高执行速度和效率;降低设计成本,提高了系统的牢靠性;可以供应直接支持高级语言的才能,简化编译程序的设计;缺点:加重了汇编语言程序员的负担;对浮点运算和虚拟储备器的支持不够抱负;相对来说, RISC 机器上的编译程序要比CISC 机器上的难写;名师归纳总结 - - - - -
10、- -第 6 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思10. 如何提高 Cache的命中率?采纳预取技术提高命中率思想:不命中时, 把 M2 储备器中相邻几个单元组成的一个数据块都取出来送入M1 储备器中;11. 储备系统的主要性能参数 储备容量:储备价格:储备速度:12. 如何提高储备器频宽?地址码高位交叉多个储备器并行,采纳并行 器);设置各种缓冲储备器;/交叉拜访等方法提高储备器的拜访速度(并行储备采纳储备体系,特殊是 Cache储备体系;13. 流水线最大吞吐率的运算吞吐率:单位时间内能流出的任务数或能流出的结果数;TP=
11、n/Tm n :任务数;Tm:处理完成 n 个任务所用的时间;名师归纳总结 - - - - - - -第 7 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思14. 流水线的分类分类一:单功能流水线 多功能流水线分类二:静态流水线 动态流水线分类三:线性流水线 非线性流水线分类四:部件级流水线 处理机级流水线 系统级流水线其 它:标量流水线 向量流水线 次序流水线 异步流水线15. 常见的数据相关有哪些?通常在哪些流水线上会显现?“ 先写后读” 相关“ 先读后写” 相关“ 写写” 相关“ 先写后读”相关在流水线次序执行和乱序执行时都可能发
12、生,“ 先读后写”相关和“ 写写” 相关只有在流水线乱序执行时才可能发生,而“ 读读” 相关无需处理;16. 对分支指令引起的全局相关通常是如何处理的?名师归纳总结 - - - - - - -第 8 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思条件出来前:提前形成条件码猜测条件出来后:停顿17. Tomasulo算法和前瞻执行机制中的换名功能分别是如何实现的?18. 向量处理机的常见的相关和冲突有哪些?相关:V0V1V2 V0V1V2 V3V4 V5 V3V0 V4 a 不相关的指令 b 写读数据相关 V0V1V2 V0V1V2 V3
13、V4V5 V3V1 V4 c 功能部件冲突 d 读读数据相关 提示:采纳次序发射次序完成方式;19. 评判向量处理机性能的参数有哪些?及其详细用途是什么?向量指令处理时间 Tvp:(1)一条向量指令的处理时间:TvpTs + Tvf + n - 1 Tc 其中:Tvp 为一条向量指令的处理时间;Ts为向量流水线的建立时间;Tvf 为向量流水线的流过时间;Tc 为流水线“ 瓶颈” 段的执行时间;n 为向量长度;名师归纳总结 - - - - - - -第 9 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思假如每段执行时间都等于一个时钟周期,
14、就有:Tvps + e + n - 1 其中:s 为向量流水线建立时间所需的时钟周期数;e 为向量流水线流过时间所需的时钟周期数;n 为向量长度; 为时钟周期长度;(2)一批向量指令的处理时间:编队数向量长度向量寄存器长度时:T ni1T startn1 T c编队i其中:Tstart 为每个编队的向量启动开销,即流水线建立时间 +流过时间;Tc 为流水线“ 瓶颈” 段的执行时间;n 为向量长度;Tchime 为编队数;向量长度向量寄存器长度时:需进行分段开采,向量长度为n 的一组向量操作的整个执行时间为:T nnT loopT startnT chimeTchimeMVL其中:Tloop 为
15、执行标量代码的开销, Tstart为每个编队的向量启动开销,为编队数, MVL 是向量寄存器的长度;的 Tloop 约等于 15;最大性能 R:Tloop 可以看作是一个常数, Cray 1 机R表示当向量长度为无穷大时的向量流水线的最大性能;常在评判峰值性能时 使用,单位为 MFLOPS;可表示为:Rlim浮点运算次数时钟频率循环所花费时钟周期数浮点运算次数时钟频率lim nT nn其中: n 为向量长度; Tn 为一组向量操作的整个执行时间;名师归纳总结 - - - - - - -第 10 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而
16、精思半性能向量长度 n1/2:为达到一半R值所需的向量长度称为半性能向量长度n1/2,主要评判向量流水线建立时间对性能的影响;1R浮点运算次数时钟频率浮点运算次数2时钟频率2循环所花费时钟周期数T n1 /n 1/2向量长度临界值nv:nv 表示向量流水方式的工作速度优于标量串行方式工作时所需得向量长度临界值;该参数既衡量建立时间,也衡量标量 /向量速度比对性能的影响;20. 常用的互连函数恒等置换交换置换方体置换匀称洗牌置换蝶式置换位序颠倒置换移数置换加减 2i 置换21. Omega网络的结构和特点采纳 2 2 的四功能开关,对于 N N 网络,有 n=log2N 个开关级,每级有 N/2
17、个开关;n 个开关级从输入端到输出端依次为 Kn-1 、 K1 、 K0,n+1 个级间连接依次为 Cn 、 C1、 C0, 其中 C0 为恒等置换,C1Cn 都为匀称洗牌置换; 开关采纳单元掌握方式; 本网络也称为: 多级洗牌置换网络或多级混洗网络;名师归纳总结 - - - - - - -第 11 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思Omega 级掌握且开关为二功能开关 STARAN 交换网络的逆网络;部分级掌握且开关为二功能 STARAN 移数网络的逆网络;单元掌握且开关为二功能 n 方体网络的逆网络;22. 多级立方体互
18、连网络的特点23. 什么是多处理机中不会引起Cache不一样?导致的缘由有哪些?Cache一样性是指私有 Cache中共享数据的副本和共享储备器中共享数据之间的 一样性;导致不一样的缘由:(1)共享可写数据引起的不一样性名师归纳总结 - - - - - - -第 12 页,共 13 页精选学习资料 - - - - - - - - - 读书之法 ,在循序而渐进 ,熟读而精思(2)进程迁移引起的数据不一样性(3)I/O 传输造成的数据不一样性 前两种缘由的解决方法:监听法 目录法第三种缘由的解决方法:禁止法 刷新法 24. 多处理机系统的两种基本结构分别为?集中式 分布式 25. 解决多处理机 C
19、ache一样性的方法有哪些?详细用在什么环境中?26. 多处理机中实现同步的常见基本硬件原语有哪些?1.原子交换:将一个储备单元的值和一个寄存器的值进行交换;实现同步的关键:操作的原子性(交换操作是不行再细分的);2.测试并置定:先测试一个储备单元的值,假如符合条件就修改其值;3.读取并加 1:返回储备器中的值并以原子操作的方式使储备器中的值增 1;4.使用指令对 :LL/SC :LLload linked 或 load locked:特殊的取指令 SCstore conditional:特殊的存指令 指令对功能:假如由 LL 指明的储备单元的内容在 就其次条指令 SC 执行失败;SC 对其进行写之前已被其他指令改写过,假如在两条指令间进行切换也会导致 SC 执行失败;SC 将返回一个值来指出该指令操作是否胜利:LL 就返回该储备单元初始值;“ 1” 表示胜利,“ 0” 表示不胜利名师归纳总结 - - - - - - -第 13 页,共 13 页