《《微机接口技术概论》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《微机接口技术概论》PPT课件.ppt(56页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、微机系统与接口技术微机系统与接口技术本课程在计算机课程体系中的位置本课程在计算机课程体系中的位置 本课程是本课程是计算机科学与技术计算机科学与技术和和信息安全信息安全等专等专业本科和专科学生必修的一门专业课。业本科和专科学生必修的一门专业课。其前修课程有其前修课程有大规模集成电路大规模集成电路、计算机组成计算机组成原理、计算机系统结构、数据结构原理、计算机系统结构、数据结构等。等。为进一步学习和研究为进一步学习和研究计算机网络、分布式系计算机网络、分布式系统统、大规模并行处理系统大规模并行处理系统、计算机集群、网格系计算机集群、网格系统统等打下坚实的基础。等打下坚实的基础。本课程的教学目的本课
2、程的教学目的 系统系统学习学习微处理器、内外存储器、各种控制器微处理器、内外存储器、各种控制器和输入和输入/输出接口芯片的结构和原理,掌握构成现代输出接口芯片的结构和原理,掌握构成现代微机系统的硬软件组成和接口技术。微机系统的硬软件组成和接口技术。切切切切实实实实掌掌掌掌握握握握微微型型计计算算机机实实现现技技术术、计计算算机机主主板板组组成成原原理理、各各种种接接口口设设计计及及其其驱驱动动编编程程方方法法、微微机机系系统的研究和开发。统的研究和开发。深深深深入入入入了了了了解解解解微微处处理理器器和和微微机机系系统统的的新新发发展展和和新新技技术术,学学会会系系统统科科学学地地分分析析问问
3、题题和和解解决决问问题题,提提高高认认知能力和创新能力。知能力和创新能力。本课程的要求本课程的要求同同学学们们不不仅仅要要学学习习3232位位微微处处理理器器的的原原理理及及微微机机各各种种接接接接口口口口电电电电路路路路的的原原理理与与作作用用,而而且且还还要要掌掌握握常常用用接接口口的的设设计计与与分分析析方方法法,并并具具有有一一定定的的动动动动手手手手实实实实验验验验能能能能力力力力和和接接接接口口口口应应应应用用用用程程程程序序序序的的的的编编编编写写写写能能能能力力力力,为为将将来来的的学学习习与实践打下良好基础。与实践打下良好基础。请请请请同同同同学学学学们们们们下下下下载载载载
4、电电电电子子子子讲讲讲讲义义义义,在在在在课课课课堂堂堂堂上上上上注注注注意意意意听听听听讲讲讲讲并并并并在在在在讲讲讲讲义义义义中中中中补补补补充充充充课课课课堂堂堂堂笔笔笔笔记记记记,认认认认真真真真独独独独立立立立完完完完成成成成作作作作业业业业,做做做做好实验、做好课前预习和课后复习。好实验、做好课前预习和课后复习。好实验、做好课前预习和课后复习。好实验、做好课前预习和课后复习。本课程的教材本课程的教材本课程内容组织本课程内容组织第二章第二章第二章第二章-3232位微处理器位微处理器体系结构与工作原理体系结构与工作原理第三章第三章第三章第三章-内存储器内存储器:半导体存储器半导体存储器
5、 、存储器硬件组织、存储器硬件组织、存储器子系统存储器子系统第五章第五章第五章第五章-微机与外设数据交换微机与外设数据交换:中断方式与中断方式与8259 DMA8259 DMA方式与方式与82378237第六章第六章第六章第六章-总线技术总线技术:系统总线系统总线 局部总线局部总线 外设总线外设总线 通信总线通信总线第七章第七章第七章第七章-用户交互接口用户交互接口:键盘接口、打印机接口键盘接口、打印机接口 、显示器接口、显示器接口 第八章第八章第八章第八章-外存储器外存储器:磁记录编码、磁记录编码、EIDEEIDE和和SCSISCSI接口、磁盘阵列、光盘接口、磁盘阵列、光盘第四章第四章第四章
6、第四章-I/OI/O接口接口:计数器计数器82C54 82C54 并行接口并行接口82C55A 82C55A 串行通信与串行通信与82508250第一章第一章第一章第一章-微机系统和接口的组成原理,典型微处理器简介微机系统和接口的组成原理,典型微处理器简介第九章第九章第九章第九章微计算机组成微计算机组成:IBM PC/XTIBM PC/XT、IBM PC/ATIBM PC/AT、3232位微机系统位微机系统第一第一章章 概概 论论1.1 微计算机系统组成微计算机系统组成 微微型型计计算算机机属属于于第第四四代代电电子子计计算算机机产产品品。一一般般主主机机按按体体积积、性性能能和和价格分为巨型
7、机、大型机、中型机、小型机和微型机五类。价格分为巨型机、大型机、中型机、小型机和微型机五类。起起初初,中中央央处处理理器器CPUCPU的的运运算算器器和和控控制制器器集集成成在在一一片片集集成成电电路路芯芯片片上上,称为称为微处理器微处理器MPUMPU。微微处处理理器器是是微微机机系系统统的的核核心心部部分分,自自7070年年代代初初出出现现第第一一片片微微处处理理器器芯芯片片以以来来,微微处处理理器器的的性性能能和和集集成成度度几几乎乎每每两两年年翻翻一一番番,其其发发展展速速度度大大大超过了前几代计算机大超过了前几代计算机。1.1.1 1.1.1 微机系统、微计算机和微处理器微机系统、微计
8、算机和微处理器1.2 典型微处理器简介典型微处理器简介1.2.1 8位微处理器位微处理器特点特点产品产品:Intel 8080,Motorola 6800,Zilog Z80,Rockwell R6502特点:特点:线宽:线宽:2m,NMOS,8000管管 主频:主频:1MHz(M6800),),2MHz(8080),(),(Z80)总线:总线:8DB,16AB,40DIP 寄存器:寄存器:8080有有9个:个:B、C、D、E、H、L以及以及W、Z,累加器、,累加器、SP、PC MC6800有有6个:个:PC、SP、IX、CCR Z80有有18个个8位寄存器以及位寄存器以及4个个16位寄存器位
9、寄存器PC、SP、IX、IY I/O端口:端口:i8080和和Z80是独立编址,是独立编址,M6800是存储器映像是存储器映像 指令:指令:7080条条 周期为周期为2s 时钟:单时钟:单/多相多相 电源:单电源:单/多电源,多电源,5v、12v 功能:中断、堆栈、微程序控制功能:中断、堆栈、微程序控制 语言:汇编,高级语言的解释和编译语言:汇编,高级语言的解释和编译 应用:商业和实时控制、智能终端、生产应用:商业和实时控制、智能终端、生产/进程控制,进程控制,PC 1.2.1 8位微处理器位微处理器i8080Intel8080Intel8080:由:由80808080芯片,系统控制器芯片,系
10、统控制器82288228,时钟发生,时钟发生/驱动器驱动器82248224构成。构成。1973 1973年年Motorola6800Motorola6800:ALUALU、指令译码和控制、寄存器组、指令译码和控制、寄存器组、I/OI/O和数据缓冲。和数据缓冲。19741974年年 1.2.1 81.2.1 8位微处理器位微处理器M6800M68001.2.1 81.2.1 8位微处理器位微处理器Z80Z80Z80Z80:由:由ALUALU、控制部件、寄存器组、总线及其缓冲器组成。、控制部件、寄存器组、总线及其缓冲器组成。19771977年。年。两组通用两组通用R R、变址、变址R R、中断页面
11、、中断页面I I、刷新计数器、刷新计数器R R,较强中断能力,较强中断能力,电源时钟单一,电源时钟单一,158158条指令、兼容条指令、兼容80808080指令系统指令系统1.2.2 161.2.2 16位微处理器位微处理器-i8086/i8088-i8086/i8088(1 1)1.Intel 8086/8088(1978/1979年)年)线宽:线宽:1.5m COMS工艺工艺 万管万管 5MHz8MHz主频主频 DB:内部:内部:16位,外部:位,外部:8086为为16位,位,8088为为8位位 AB:20位,寻址位,寻址1MB地址空间地址空间 EU:ALU AX、BX、CX、DX:通用寄
12、存器:通用寄存器 SP、BP:指针寄存器:指针寄存器 DI、SI:变址寄存器:变址寄存器 FLAGS:状态标志:状态标志CF、PF、AF、ZF、SF、OF 控制状态控制状态DF、IF、TF 指令译码指令译码 控制电路控制电路 BIU:CS、DS、SS、ES 段寄存器段寄存器 IP指令指针指令指针 内部通信寄存器内部通信寄存器 20位地址加法器:位地址加法器:REGx16偏移量偏移量 指令队列指令队列FIFO:8088是是4B,8086是是6B 总线控制电路总线控制电路 1.2.2 161.2.2 16位微处理器位微处理器-i8086/i8088-i8086/i8088(2 2)BIU:与内存及
13、I/O芯片接口,提供总线控制信号,执行外部总线周期,根据EU请求完成取指和数据交换;EU:指令执行,进行数据处理和有效地址计算并管理R1.2.2 161.2.2 16位微处理器位微处理器-i80186/i80188-i80186/i801882.Intel 80186/80188 单片机:内含单片机:内含 8MHz主频、主频、68引脚的引脚的 8086/8088 时钟发生器时钟发生器 片选和准备好电路片选和准备好电路 一个中断控制器:一个中断控制器:PIC(1)二个二个DMA通道:通道:DMAC(2)三个定时器三个定时器/计数器:计数器:CNT(3)应用:智能控制器、网卡等应用:智能控制器、网
14、卡等 1616位微处理器位微处理器-i80286-i80286(1 1)3.Intel 80286(1982年)(1)概况 增强16位,线宽2m,万管,625MHz主频 DB:16 四列直插封装 AB:24 片内MMU:物理地址16MB,虚拟地址1GB 工作模式工作模式:实(地址)模式实(地址)模式:8086全部功能。保护(虚拟地址)模式保护(虚拟地址)模式:实模式存储管理虚存支持保护多任务多用户支持,4级特权保护级特权保护:支持OS与任务分离,支持任务中程序与数据保护 CS、DS、SS、ES TSS任务状态段、DTS描述符表段(GDT、LDT、IDT)15条新指令1.2.2 161.2.2
15、16位微处理器位微处理器-i80286-i80286(2 2)总线部件总线部件BUBU 指令部件指令部件IU IU 执行部件执行部件EU EU 地址部件地址部件AUAU每个部件可与其他部件异步并行操作,运行速度比较快每个部件可与其他部件异步并行操作,运行速度比较快1.2.2 161.2.2 16位微处理器位微处理器-i80286-i80286(3 3)(2)内部结构:)内部结构:BU,IU,EU,AUBU:CPUDB 与与80287FPU接口接口 预取器和预取器和6B指令队列指令队列IU:指令译码器:指令字节:指令译码器:指令字节69位微码位微码 已译码指令队列:容纳已译码指令队列:容纳3条指
16、令条指令EU:ALU 寄存器组:通用寄存器,寄存器组:通用寄存器,FLAGS 控制电路:控制电路:69位微码位微码控制电位序列控制电位序列AU:实地址模式:段基址偏移量:实地址模式:段基址偏移量20位物理地址位物理地址 保护模式:存储保护:许可性、段限制保护模式:存储保护:许可性、段限制 逻辑地址逻辑地址 线性地址即线性地址即24位物理地址位物理地址1.2.3 321.2.3 32位微处理器位微处理器-i80386-i80386(1 1)1.Intel 80386系列()系列()全全32位体系结构位体系结构 MMU片内,片内,Cache片外片外 ,CHMOS工艺,工艺,132引脚,万管引脚,万
17、管 主频:主频:12.540MHz 物理地址物理地址4GB、虚存空间、虚存空间64TB 段页式虚存段页式虚存 6级流水线级流水线(1)内部结构内部结构:6个部件组成,指令流水线,地址流水线个部件组成,指令流水线,地址流水线 总线接口部件:总线接口部件:CPU 芯片总线芯片总线 特权请求控制器特权请求控制器 地址驱动器地址驱动器 总线带宽控制器总线带宽控制器 多路收发器多路收发器 接收预取部件取指和执行部件传数的请求,并做优先权处理;产生总线周期地址、数据和控制信号;与其它总线主控设备和协处理器接口。1.2.3 321.2.3 32位微处理器位微处理器-i80386-i80386(2 2)总线接
18、口总线接口 指令预取指令预取 指令译码指令译码 执行执行 分段分段 分页部件分页部件1.2.3 321.2.3 32位微处理器位微处理器-i80386-i80386(3 3)指令预取部件指令预取部件 预取器:总线空闲时,通过BIU按序取指送入预取队列。预取队列(16B)指令译码部件。指令译码部件指令译码部件 指令译码:指令字节内部码 已译码指令队列:缓冲深度3条指令 、部件组成80386的指令流水线执行部件执行部件 控制器 数据处理器 保护检测 把已译码指令队列中的内部码转换成时序控制信号、其他部件 协同完成指令操作,还用专用硬件加速某些操作的执行分段部件:逻辑地址分段部件:逻辑地址线性地址线
19、性地址 三输入加法器 描述符寄存器 限长和属性PLA 经过分段有效性检查,把逻辑地址转换成线性地址1.2.3 321.2.3 32位微处理器位微处理器-i80386-i80386(4 4)分页部件:线性地址分页部件:线性地址物理地址物理地址 加法器 页Cache 控制和特性PLA 允许分页时,将从分段部件或指令预取部件得到的线性地址转换成物理地址,并用TLB加速地址变换,变换后的物理地址送BIU,完成了内存与I/O的存取 、部件组成80386的地址流水线 、部件构成存储器管理部件MMU1.2.3 321.2.3 32位微处理器位微处理器-i80386-i80386(5 5)(2)寄存器组)寄存
20、器组 32位寄存器:位寄存器:EAX、EBX、ECX、EDX、ESI、EDI、EBP、ESP 指令指针:指令指针:EIP(32)、IP(16)EFLAGS:VM、RF、NT、IOPL、OF、DF、IF、TF、SF、ZF、AF、PF、CF VM:虚拟8086模式 RF:恢复标志 NT:任务嵌套 IOPL:I/O特权级 控制R CR0:定义控制标志 CR1:保留 CR2:页故障线性地址 CR3:页目录表基址 系统地址寄存器 测试寄存器 调试寄存器 段寄存器(16位):CS、SS、DS、ES、FS、GS1.2.3 321.2.3 32位微处理器位微处理器-i80386-i80386(6 6)(3)工
21、作模式)工作模式 实模式:与实模式:与8086相同,可以处理相同,可以处理32位数据,增加位数据,增加FS、GS 保护模式:保护模式:4GB物理空间、段长可达物理空间、段长可达1MB(不用页)(不用页)/4GB(启动页)(启动页)多任务保护机制多任务保护机制 虚拟虚拟8086模式:实模式保护功能模式:实模式保护功能(4)存储地址空间)存储地址空间物理地址空间物理地址空间 4GB 虚拟地址空间虚拟地址空间64TB1.2.3 321.2.3 32位微处理器位微处理器-i80386-i80386(7 7)(5)80386 Family 80386 DX 全32位,80386原型 80386 SX 外
22、部DB16位,外部AB24位 80386 SL 采用低功耗和SMM(系统管理模式)的80386SX和5V电源,SMI和静态CMOS工艺,系统闲置时工作频率降到0Hz进入休眠状态,功耗低于 80386 DL 采用SL技术的80386DX,低功耗和节能型 80386 EX AB为26位的80386SX,增加系统管理模式和能源管理技术,主要应用于嵌入式系统1.2.3 321.2.3 32位微处理器位微处理器-i80486-i80486(1 1)2.Intel 80486系列()系列()(1)特点特点工艺 120万管 25120MHz 168针PGA RISC技术:40MIPS,常用指令执行仅1T微码
23、控制部分硬布线逻辑,降低指令执行的时钟数突发总线(Burst BUS)技术。地址相关的16B数据I/O内部集成了FPU和Cache,并支持二级Cache内部结构:总线接口部件 指令预取部件 指令译码部件 控制部件 整数部件 段部件:重定位 页部件:固定页面 Cache:数据与指令共用8KB,4路组相联 FPU:算术运算,超越函数 全32位体系结构:地址总线、数据总线和寄存器组 数据总线动态变换:8/16/32位1.2.3 32位微处理器-i80486(2)总线接口 指令预取 指令译码 控制 整数 分段 分页 Cache 浮点部件1.2.3 321.2.3 32位微处理器位微处理器-i80486
24、-i80486(3 3)(2)80486系列系列 80486DX80386803878K BCache及控制器及控制器 80486SX80386 8KBCache及控制器及控制器 80486SL 低功耗节能型低功耗节能型80486DX 能工作在,电源切断电路,能工作在,电源切断电路,SMI,休眠状态,休眠状态 80486SX2 时钟倍频技术的时钟倍频技术的80486SX 80486DX2 时钟倍频技术的时钟倍频技术的80486DX Intel DX4 时钟时钟3倍频技术的倍频技术的80486DX工艺,时钟频率工艺,时钟频率100NHz,16KBCache1.2.3 321.2.3 32位微处理
25、器位微处理器-Pentium(1)3.Intel Pentium系列系列(1)Pentium()奔腾()奔腾l静态BiCMOS工艺,310万管,273脚PGA,60233MHz主频,RISC与CISC结合产品。l超级流水线:U、V两条流水线,1T执行2条指令,每条流水线都有ALU、地址生成逻辑和数据Cache接口,5级流水。l高性能FPU:浮点数运算高度流水线化,8级流水,每T可完成12个浮点操作l独立的指令Cache和数据Cache,都是8KB,数据Cache有二个接口分别与U、V两条流水线相连,2路组相联存储器。l分支预测:提高性能到达90MIPS 分支目标缓冲器(BTB)的小Cache来
26、动态预测程序的分支操作。l64位外部DB:用于同内存以528MB/S(66MHz钟频)交换数据,1个突发总线周期读入256位数据。1.2.3 321.2.3 32位微处理器位微处理器-Pentium(2)600nmBiCMOS600nmBiCMOS工艺工艺 超级流水线超级流水线 高性能高性能FPU FPU 独立指令和数据独立指令和数据CACHE CACHE 分支预测分支预测 外部外部DB64DB64位位1.2.3 321.2.3 32位微处理器位微处理器-Pentium Pro(1)(2)Pentium Pro()高能奔腾()高能奔腾l0.25m 四层BiCMOS工艺,387脚PGA,1554
27、33MHz。lCPU内核:有8KB代码L1 Cache8KB数据L1Cahce,550万管,与CPU同频的256KB L2 Cache,1550万管,64位全速总线相连。l5个并行处理单元:整数(2)、存储(1)、装载(1)、浮点(1)。lCISC指令RISC化:将指令分解为微操作l乱序执行(Out of order execution):CPU允许指令不按程序顺序发给处理单元,能提前的立即分发执行,然后重排单元将结果按指令顺序重排,CPU内电路满负荷,提高其运行速度l动态分支预测和推测执行(dynamic branch prediction,speculative exec.)l3路超标量结
28、构和14级流水线结构:提高并行处理能力1.2.3 321.2.3 32位微处理器位微处理器-Pentium Pro(2)1.2.3 321.2.3 32位微处理器位微处理器-Pentium MMX(3)Pentium MMX(Multimedia extension)()多能奔腾)()多能奔腾l工艺,450万管,160233MHz,4种新的数据类型,8个64位寄存器和57条新指令,对IA-32指令系统扩展(浮点寄存器 别名映象),A/V,图形图象处理,多媒体及通信。l新数据类型:紧缩的字节、字、双字和四字的64位数据放在8个64位 寄存器,采用SIMD技术单指令处理多个数据l饱和运算:环绕处理
29、:F000H+4000H=3000H 溢出截断,低位返回,进位丢失 饱和运算:F000H+4000H=FFFFH 溢出结果截至数据类型最大/小位 适用于图形等多媒体处理l积和运算:矢量点积和矩阵乘法是A/V和图象数据基本运算 指令:PMADDWD积和运算指令用于压缩/解压lSIMD技术:与紧缩数据类型配合提高性能1.2.3 321.2.3 32位微处理器位微处理器-Pentium II(4)Pentium II()()AMD K6-2工艺,750万管,233450MHzPII=Pentium Pro+Pentium MMX两级两级Cache:L1为16KB16KB,L2为512KB,移到片外,
30、运行频率为CPU核心频率一半,64位高速总线。除掉L2 Cache即为Celeron(赛扬)处理器,浮点与PII持平,后加入高速128KB Cache。动态执行动态执行 多分支预测:预测程序流向,加速处理器的工作流程。数据流分析:分析指令流数据依赖关系,优化指令执行排序。推测执行:并行推测执行指令,使执行单元始终处于运行状态。双重独立总线结构双重独立总线结构 DIB L2 Cache总线(L2 Cache与CPU专用总线)和系统总线(用于Mem.)可提供3倍于单一总线结构处理器的带宽性能。单边接触盒(单边接触盒(SEC)封装)封装 CPU和L2 CacheSEC Slot1 主板 双64位后端
31、总线 非PGA 242触点1.2.3 321.2.3 32位微处理器位微处理器-Pentium III(5)Pentium III()()AMD K7-Athlonl工艺,950万管,70条SSE(Streaming SIMD Extensions)指令:用于语言识别、实时压缩、三位图象处理、A/V处理。lL1 Cache:16KB指令Cache和16KB数据Cache;L2 Cache:512KB,为CPU核心速度的一半。l8x128bit单精度寄存器:同时处理4个单精度(4x32位)浮点变量,20亿次/秒浮点运算。l继承了PII的动态执行,双重独立总线技术,100MHz前端总线。1.2.3
32、 32 1.2.3 32位微处理器位微处理器-PIII Coppermine(6)Pentium III Coppermine()()l工艺,主频733MHz,外频133MHz,2800万管,l 256KB的L2 Cache置于片内,工作在CPU核心频率下lCache转换架构 L2Cache256b宽通路,每时钟传32B,带宽。l先进的系统缓冲器 填充Buffer:4 6 总线队列:4 8 回写缓冲器:1 4l移动PC的SpeedStep技术 降低速度和电压后,延长运行时间;外接电源时,以全速全压运行。l2000.6 AMD Athlon(Thunderbird,雷鸟)与PIII Copper
33、mine有相同的缓存特性,同时将L2缓存间联合并发处理的通道数从2个增到16个,性能提升。1.2.3 321.2.3 32位微处理器位微处理器-Pro PII PIII 1.2.3 321.2.3 32位微处理器位微处理器-Pentium 4(1)(7)Pentium IV或或Pentium 4()()l工艺,6层铝金属层,4200万管,面向互联网技术,内核构架NetBurst,IA-32体系结构l超级流水线技术:20级(PIII是10级),ALU用内核频率的2倍,直接加速了 整数指令的执行速度。将取指、译码、取数、执行和回写 分给指令流水线不同级同时处理l执行跟踪缓存 指令L1CacheEx
34、ectcion Trace Cache 指令解码执行跟踪缓存(1200条微操作)第1级流水 出现分支预测错误,可从跟踪缓存中重新获取微操作,减少预测错误影响。l高级动态执行引擎:为EU动态提供指令不使其停顿 不等待数据的指令送到EU去执行 增强的分支预测功能和BTB(4KB)高效的乱序推测能力减少预测失败引起的延迟l快速执行引擎:ALU在时钟的上升和下降沿都执行运算,是CPU主频的两倍,平均半个时钟周期完成1条指令,采用的是时钟缓冲(Clock buffering)电路。1.2.3 321.2.3 32位微处理器位微处理器-Pentium 4(2)1.2.3 321.2.3 32位微处理器位微
35、处理器-Pentium 4(3)lSSE2指令:对指令:对Internet、3D和多媒体技术和多媒体技术 144组指令组指令 提升多媒体指令的执行性能提升多媒体指令的执行性能 128bit的的MMX寄存器寄存器 128bit的的SIMD整数运算整数运算 128bit的双精度浮点运算的双精度浮点运算 提升多媒体指令的执行性能,如提升多媒体指令的执行性能,如DVD/MP3/MPEG-4的回放的回放l400MHz系统总线配合系统总线配合800MHz的的RDRAM,其内存带宽,即,其内存带宽,即数据传输率数据传输率 采用采用QDR(Quad Date Rate)技术:)技术:4条条64位数据流位数据流
36、1.2.4 64位微处理器-基本术语l指令集指令集 CISC:X86、x86-64指令集的Intel、AMD等处理器。RISC:PowerPC,SPARC,PA-RISC,MIPS,Alpha等 EPIC:Itanium,Itanium II X86-64:AMD64、EM64T(前身是IA-32E)lCPU扩展指令集扩展指令集 MMX:57条多媒体指令 SSE:70条:50条SIMD浮点运算、12条MMX整数运算、8条优化数据块传输 SSE2:144条:SSE部分和MMX部分 SSE3:13条:数据传输、数据处理、特殊处理、优化命令、超线程性能增强l超标量和超流水线超标量和超流水线 超流水线
37、通过流水细化,提高主频,在1T内完成多个操作,以时间换取空间;超标量是内置多路流水线实时执行多处理器,以空间换取时间l封装封装 针栅阵列(PGA)封装的MPU使用socket插座 单边接触盒(SEC)封装的MPU使用slot X1.2.4 641.2.4 64位微处理器位微处理器-Itanium1.Itanium(开发代码开发代码 Merced,安腾,安腾,Intel和和HP)IA-64架构架构:64位寻址能力和64位寄存器工艺:亿管 指令定长,降低解码复杂度 指令可对寄存器操作 显式并行指令计算(EPIC)技术 编译器:分析指令间依赖关系 无依赖关系的指令组合 执行部件:成组的指令群并行执行
38、 并行调度是编译时由软件决定,硬件调度会增加复杂性和提高成本 3级高速缓存:L1 32KB(指令和数据),L2 256KB,Itanium 2的L3有9MB,其双核的L3有24MB IA-64的分支预测在编译控制,分支判断与分支语句同时执行。投机装载:数据预装 数据提前几十个周期放入L1 Cache,避免未命中,减少访存 主频高 ,400MHz系统总线,CPU带宽1.2.4 64位微处理器位微处理器-Itanium IIIA-64架构架构:向双核或多核发展主要特点主要特点:EPIC指令集 分支预测 推测执行 集束指令工作模式工作模式:由处理器状态寄存器PSR决定执行IA-64指令集 还是IA-
39、32指令集5组部件组部件:指令处理、执行、控制、内存子系统、IA-32兼容执行引擎IA-32兼容执行引擎兼容执行引擎:指令预取、解码、调度和控制、专用执行单元:通用寄存器、选择器、描述符寄存器、浮点寄存器、MMX寄存器、SIMD流扩展寄存器等IA-32EC技术技术:IA-32执行层技术将IA-32代码译成原始IA-64代码,充分利用IA-64强大资源,IA-32EL软件是与硬件分离的执行层软件,可全面增强IA-64系统上IA-32软件的执行性能争议问题争议问题:IA-64处理器引入了x86 to IA-64解码器,但不是最有效2.AMD64 AMAMD D D D 使用使用使用使用x86x86
40、x86x86结构并扩展到结构并扩展到结构并扩展到结构并扩展到64646464位来获得位来获得位来获得位来获得x86-64x86-64x86-64x86-64结构结构结构结构-处理器能全速高性能地运行处理器能全速高性能地运行处理器能全速高性能地运行处理器能全速高性能地运行x86x86x86x86和和和和x86-64x86-64x86-64x86-64程序程序程序程序-64-64-64-64位模式不采用分段模式位模式不采用分段模式位模式不采用分段模式位模式不采用分段模式-具有长模式和遗传模式,长模式包括具有长模式和遗传模式,长模式包括具有长模式和遗传模式,长模式包括具有长模式和遗传模式,长模式包括
41、64646464位模式和兼容模式(允许位模式和兼容模式(允许位模式和兼容模式(允许位模式和兼容模式(允许现有程序无需修改就运行在长模式下)现有程序无需修改就运行在长模式下)现有程序无需修改就运行在长模式下)现有程序无需修改就运行在长模式下)真正的真正的真正的真正的64646464位位位位x86x86x86x86芯片,增加到芯片,增加到芯片,增加到芯片,增加到16161616个个个个64646464位位位位REG.,8REG.,8REG.,8REG.,8组组组组128128128128位位位位SSE REG.,SSE REG.,SSE REG.,SSE REG.,给给给给SIMDSIMDSIMD
42、SIMD提供更多空间提供更多空间提供更多空间提供更多空间1.2.4 64位微处理器位微处理器-AMD64(1)1.2.4 641.2.4 64位微处理器位微处理器-AMD 64(2)AMD 64位位MPU体系架构体系架构“Hammer”l面向4路及8路服务器市场。补充Athlon MP 32位MPUl适用于大型数据库,数据挖掘,在线事务处理等企业级应用l集成化的DDR DRAM控制器,支持ECC内存,检查和纠正内存中的代码错lAMD的HyperTransport总线结构:使PC内部芯片之间的数据传输速率达到此技术得到Apple、Cisco、Sun、Transmeta、Nvidia、API、PM
43、C-Sierra等支持AMD支持支持64位技术:位技术:Athlon 64系列(速龙)、系列(速龙)、Opteron系列(皓龙)、系列(皓龙)、Sempron系列(闪龙)、系列(闪龙)、Turion系列(炫龙)系列(炫龙)1.2.4 64位微处理器位微处理器-Intel EM64T 3.Intel EM64T,前身是前身是IA-32E -Intel-Intel扩展扩展6464位内存技术,增强位内存技术,增强IA-32IA-32结构,扩展到结构,扩展到6464位结构操作位结构操作-完全兼容现在的完全兼容现在的IA-32IA-32结构和结构和x86-64x86-64技术技术-具有传统具有传统IA-
44、32IA-32模式和扩展模式和扩展IA-32eIA-32e模式,扩展模式,扩展IA-32eIA-32e模式包括模式包括6464位位模式和兼容模式,由扩展功能激活寄存器模式和兼容模式,由扩展功能激活寄存器IA-32_EFERIA-32_EFER选定。选定。-64-64-64-64位模式下具有以下特性:位模式下具有以下特性:位模式下具有以下特性:位模式下具有以下特性:64 64位线性平面地址位线性平面地址 增加增加8 8个新的通用寄存器,都扩展到个新的通用寄存器,都扩展到6464位位 增加增加8 8个个128128位位SIMDSIMD流扩展寄存器(流扩展寄存器(SSE,SSE2SSE,SSE2和和
45、SSE3)SSE3)64 64位宽的通用寄存器和指令指针寄存器位宽的通用寄存器和指令指针寄存器1.2.5 1.2.5 微处理器简介汇总微处理器简介汇总(1 1)1.2.5 1.2.5 微处理器简介汇总微处理器简介汇总(2 2)时钟频率时钟频率体系结构体系结构 指令部件指令部件Pentium 60233MHz IA-32RISCCISC 2路超标量流水线结构:U和V流水线 Pentium Pro 155433MHz IA-32CISC指令RISC化 3路超标量流水线结构;3个并行译码器 Pentium MMX 160233MHz IA-32RISCCISC具有Pentium的所有特性并采用多媒体
46、扩展(MMX)和SIMD技术 Pentium 233450MHz Pentium Pro+MMX MMX技术融入到Pentium Pro中;多媒体增强技术;SIMD技术 Pentium 0.451.4GHz IA-32在P基础上新增70条SSE指令和8个128位单精度寄存器 P Coppermine 0.51.33GHz IA-32先进的系统缓冲器;6个填充缓冲器;8条总线队列;4个回写缓冲器 Pentium 4 1.32.4GHz IA-32 内核架构NetBurst 超级流水线技术;支持双精度SIMD处理;SSE2指令集共有114组指令 Intel Itanium 0.91GHz IA-6
47、4(64位)包括显式并行指令计算(EPIC);328个寄存器 1.2.5 1.2.5 微处理器简介汇总微处理器简介汇总(3 3)1.2.5 1.2.5 微处理器简介汇总微处理器简介汇总(4 4)执行技术执行技术总线技术总线技术Pentium 分支预测;2个32字节的缓冲区 64位外部数据总线 Pentium Pro 动态分支预测和推测执行、乱序执行 64位外部数据(前端)总线访存;64位全速同步后端总线访L2Cache Pentium MMX 分支预测;2个32字节的缓冲区 64位外部数据总线 Pentium 动态执行技术:多分支预测;数据流分析;推测执行 双重独立总线;100MHz前端总线;
48、二级高速缓存总线 Pentium 动态执行技术;多分支预测;数据流分析;推测执行 双重独立总线结构;前端总线100或133MHz P Coppermine 动态执行技术;多分支预测;数据流分析;推测执行 内置二级Cache与CPU有256位宽数据通道;前端总线133MHz Pentium 4 高级动态执行引擎;快速执行引擎 400MHz前端总线速度:QDR技术 Intel Itanium 支持超大内存(VLM)推算功能以及推测功能 前端总线400MHz四路DDR(双倍数据传输率)微机接口技术微机接口技术微机接口技术 是通过硬件的连接和软件的控制,将微处理器和各种LSI、VLSI接口芯片有效地结
49、合成微计算机系统的技术。应用接口技术的任务应用接口技术的任务 是对微机系统进行硬、软件设计,使微机能够有效地与 外部世界和用户进行联系,充分发挥它的效能。硬件接口设计的任务硬件接口设计的任务 是选择和使用适当的LSI、VLSI接口芯片构筑微处理器与 系统部件、外部设备间的接口。软件接口设计的任务软件接口设计的任务 是编制相应程序使可编程接口芯片发挥应有的功能和 提高微机系统的性能和效率。微机接口的类型微机接口的类型-运行辅助运行辅助 1.运行辅助接口运行辅助接口l微机的功能处于最(低)基本水平所需的接口微机的功能处于最(低)基本水平所需的接口lCPU芯片总线变换成系统总线的那些接口芯片总线变换
50、成系统总线的那些接口 地址锁存地址锁存 数据驱动和收发数据驱动和收发 时钟和片选等电路时钟和片选等电路l外存通过外存通过EIDE或或SCSI接口与主机系统连接接口与主机系统连接1.3.1 1.3.1 微机接口的类型微机接口的类型-用户交互用户交互2.用户交互接口用户交互接口l用户与主机系统交互的接口用户与主机系统交互的接口 表示方法和表现速度的转换表示方法和表现速度的转换终端、键盘、鼠标、操纵杆、光笔、录入笔、语音识别终端、键盘、鼠标、操纵杆、光笔、录入笔、语音识别 显示、打印、语言合成显示、打印、语言合成l表示方法的转换:外设进行转换表示方法的转换:外设进行转换 计算机与外设的不同表示计算机