《基于MV03MCU的单芯片多处理器架构设计.pdf》由会员分享,可在线阅读,更多相关《基于MV03MCU的单芯片多处理器架构设计.pdf(87页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、上海大学硕士学位论文基于MV-03 MCU的单芯片多处理器架构设计姓名:丁倩申请学位级别:硕士专业:微电子学与固体电子学指导教师:胡越黎20070101上海大学硕士学位论文摘要本文设计了一种基于M V-0 3M C UI P 核的单芯片多处理器架构。针对复杂的机器视觉系统中,图像处理要运用到大量算法的特点,使用多个M C U 并行执行不同任务,以数量的优势弥补M C U 性能的不足,用低端微处理器执行高端机器视觉、图像处理等的工作,这是设计拥有自主知识产权的图像处理器的有效方法。本文设计的单芯片多处理器在单芯片上集成了一个主处理器和三个从处理器。主处理器面向实现整个系统的管理和控制,而无需知道
2、某种具体专业算法的底层设计,从处理器响应主处理器的调度来执行这些任务算法。各个处理器之问的数据通过共享存储器交换。整个系统指令集与M C S 5 1 系列兼容,从而避免了增加使用的复杂度,而处理运算能力和并行工作能力却都得到了大大的提高。本文的主要工作和创新点体现在:1)提出并实现了基于M V-0 3M C UI P核的单芯片多处理器整体架构设计方案;2)设计了一种运用于单芯片多处理器架构的片上总线结构,解决了多处理器之间的信息、命令和状态的互传问题;3)提出了一种超级指令任务调用方法,结合单芯片多处理器硬件设计,在单芯片多处理器上实现了主从处理器之间的任务调度和并行工作;铆提出了一种共享存储
3、器及仲裁器的设计方案,实现多处理器之间的数据共享,减少数据传输工作,提高系统工作效率:5)提出了一套针对单芯片多处理器架构的验证和测试方案,有效地完成了单芯片多处理器的设计验证。本文提出的单芯片多处理器的架构,方法独特,实现便捷,经仿真证明了其可行性。同时由于M V-0 3 与M C S 5 1 架构的M C U 的兼容性,本文的设计思想、设计方法、运用的手段和工具,以及在验证过程中发现的问题和解决方法具有实际的借鉴意义和参考价值。为机器视觉系统的S o C 实现提供了具有自主知识产权的S C M PI P 核,具有很高的科学研究意义和广泛的市场应用价值。关键词;单芯片多处理器,图像处理器,片
4、上总线,共享存储器,任务调用V l上海大学硕士学位论文A B S T R A C TT h i st h e s i sd e s i g n s 觚a r c h i t e c t u r eo fS i n g l e-C h i pM u l t i p r o e e s s o rb a s e do nM V-0 3M C UI PC o r e I ns o m ec o m p l i c a t e ds y s t e m ss u c ha sM a c h i n eV i s i o nS y s t e m,i tr e q u i r e sag r e a t
5、d e a lo fo p e r a t i o n,w h i c hc o u l dn o tb ec o m p l e t e dw e l lb yo n l yo n ep r o c e s s o LI n t e r g r e a t i n gs e v e r a lp r o c e s s o r so no n ec h i pi saf e a s i b l ew a yt om e e tt h i sr e q u i r e m e n t T h eS i n g l e C h i pM u l t i p r o e a s s o r(S C
6、 M P)s y s t e mw i l li m p l e m e n t st h ea d v a n c e da p p l i c a t i o n so fm a c h i n ev i s i o na n di m a g ep r o c e s s i n gb yl o wc o s ta n dc l a s s i c a lp r o c e s s o r s A n di t sa ne f f i c i e n tw a yt od e s i g na l lI PC O No fa ni m a g ep r o c e s s o r T h
7、 ed e s i g no fS C M Pc o n n e c t sam a s t e ra n dt h r e es l a v e so no n ec h i pb yt h eo n-c h i pb u s T h em a s t e ri sr e s p o n s i b l ef o rc o n t r o l l i n go ft h ew h o l es y s t e m,a n di td o e s n tn e e dt ok n o wt h ed e t a i l so ft h ea l g o r i t h m s,w h i l
8、et h es l a v e sw h i c hw i l lb ec a l l e db yt h em a s t e rt a k ec h a r g eo fd i f f e r e n ta l g o r i t h m sf o rc e r t a i na p p l i c a t i o n s T h ed a t ae x c h a n g eo nt h i ss y s t e mi si m p l e m e n t e db yas h a r e dm e m o r y T h ei n s t r u c t i o ns e ti sc
9、a m p a t i b l et oM C S 一5 1 S T ot h et e r m i n a lu s e r s,t h e yo n l yn e e dt od e s i g nt h es o t t w a r ef o rt h em a s t e r,w h i c hm a k e si te a s yt ou s et h i sS C M EF u r t h e r m o r e,t h ec a p a b i l i t i e so f p r o c e s s i n g,c a e u l a t i o na n dp a r a l
10、 l e l l yw o r k i n ga r ei m p r o v e dg r e a t l y T h ek e yt a s k sa n di n n o v a t i o n so f t h i st h e s i sa r ep r e s e n t e da sf o l l o w s:1)D e s i g na n di m p l e m e n ta na r c h i t e c t u r eo fS i n g l e-C h i pM u l t i p r o c e s s o rb a s e do nM C 一0 3M C UI
11、Pc o r e;2 1 M a k ea ne f f i c i e n to n c h i pb u sf o rt h eS C M Pa r c h i t e c t u r ew h i c hi m p l e m e n t st h ec o m m u n i c a t i o na m o n gt h em u l t i p r o c e s s o r s;3 1 D e v e l o pa l li n n o v a t i v em e t h o do f s u p e r-i n s t m e t i o nt a s kc a l lb a
12、 s e do nt h eh a r d w a r ed e s i g no f t h eS C M ET h i sm e t h o di m p l e m e n t st h et a s ks c h e d u l ea n dp a r a l l e lw o r k i n go ft h em u l t i p r o c e s s o r s 4 1 A d o p t es h a r e dm e m o r ya n dd e s i g ni t Sa r b i t r a t o rf o rt h ed a t ae x c h a n g e
13、a m o n gt h ep r o c e s s o r s T h es h a r e dm e m o r ya v o i d sm a s st r a n s f e ro fd a t aS Ot h a ti n c r e a s et h ee f f i c i e n c yo f t h ew h o l es y s t e m 5 1 E s t a b l i s ha l le f f i c i e n tv e r i f i c a t i o ne n v i r o n m e n tf o rt h eS C M E上海大学硕士学位论文T h
14、 ea r c h i t e c t u r eo fS i n g l e C h i pM u l t i p r o c e s s o rp r o p o s e di nt h et h e s i si si n g e n i o u sa n de a s yt ob ei m p l e m e n t e d F u t h e r m o r e,b e c a u s ei th a st h ec o m p a t i b l ei n s t r u c t i o ns e tw i t ht h eM C S-51 S,t h ei d e a s,m e
15、 t h o d s,t o o l sa n ds o l u t i o n so ft h ep r o b l e m sa l ev a l u a b l ef o r t h es i m i l a rd e s i g n A n dt h eS C M PI PC o r ew i l lb et h ek e yp a r ti nt h eS y s t e m O i l C h i po fm a c h i n ev i s i o ns y s t e mw h i c hi ss i g n i f i c a n c ef o rt h ef u t u r
16、 er e s e a c ha n dm a r k e tv a l u e s K e y w o r d s:S i n g l e-C h i pM u l t i p r o c e s s o r,i m a g ep r o c e s s o r,o n-c h i pb u s,s h a r e dm e m o r y,t a s kc a l lV 原创性声明本人声明:所呈交的论文是本人在导师指导下进行的研究工作。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发表或撰写过的研究成果。参与同一工作的其他同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示
17、了谢意。签名:豆叠日期:兰里!:主:!本论文使用授权说明本人完全了解上海大学有关保留、使用学位论文的规定,即:学校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容。(保密的论文在解密后应遵守此规定)签名:三L L 导师签名:举日期:上海大学硕士学位论文1 1 引言第一章绪论集成电路技术在近2 0 年里有了飞速的发展,根据摩尔定律:单个芯片上的集成度按平均每1 8 个月翻一番的速度提高,单芯片上集成度达到了上亿数量的晶体管,加工工艺也从微米级发展到深亚微米(D S M)甚至超深亚微米级(V D S M)。照此下去,到2 0 1 0 年左右,芯片上集成的晶体管数
18、目将超过十亿个I“。I T R S(I n t c m a t i o n a T e c h n o l o g y R o a d m a p f o r S e m i c o n d u c t o r)2 0 0 4 年预测了到2 0 1 8年半导体工艺水平的发展趋判2 1,到2 0 1 8 年D R A M 的集成度可达4 7 1 G b i t S c 1 1 1 2,微处理器集成度(含片上S R A M)可达每平方厘米3 5 0 6 亿个晶体管,主频达5 3 2 0 7 G H z,即使在严格限制功耗和芯片面积的情况下,布线也会多达1 4到1 8 层,引脚达5 4 2 6 个。
19、大规模集成电路的产生和微型机的出现,使现代科学研究得到了质的飞跃。而嵌入式微控制器技术的出现则是给现代工业控制领域带来了一次新的技术革命【】。自2 0 世纪7 0 年代I n t e l 推出第一款微处理器芯片4 0 0 4,微处理器的发展己经过了三十多年的历史,相比其他大中型计算机,微处理器能够更直接更充分地利用大规模集成电路(V L S I)工艺的进步提高性能,相对稳定的3 5 的性能年增长率【6】充分体现了其性能优势。由于微处理器的功能集成度越来越高,价格越来越低,为适应集成电路技术和应用需求的不断发展,微处理器体系结构发生了翻天覆地的变化:指令处理从微程序处理到流水处理,进而演化为多条
20、流水线并行处理;指令集结构从C I S C发展到R I S C;各种提高指令级并行处理效率的技术:分支预测、指令调度、寄存器重命名、乱序流出及前瞻执行等相继涌现。当前主流通用高性能微处理器采用超标量结构和超长指令字结构(V e r yL o n gI n s t r u c t i o nW o r d V L I W),都通过开发指令级并行(I n s t r u c t i o n L e v e lP a r a l l e l i s m,I L P)来提升微处理器性能。然而,即便程序中存在着大量的I L P,所获得的I L P 还与编译技术及其结构、程序特性和数据结构都密切相关。对现
21、有的超标量结构和v L l w 结构而言,通过开发深度I L P 来提升微处理器性能受到了开发时机、开发范围和自身结构以及工艺开发等多方面限制【9。0 1。集成电路工艺的发展,通过在现有结构基础上增大流出宽度获上海大学硕士学位论文取高性能,而其引发的在面积开销、时钟频率、设计复杂性和芯片利用率等方面的弊端也越来越明显。新的微处理器体系结构必须摆脱上述限制、克服上述弊端。因此,当芯片上集成的晶体管数目不断增多的时候,单芯片多处理器结构将是一条提高微处理器性能的有效途径。在完成复杂任务时,可使用多个微处理器共同完成一个系统单元的任务;每个处理器实现一个或几个独立的模块功能,调试量小,硬件实现成本低
22、。以数量的优势来弥补低端微处理器的一些性能的不足,这是一种运用低端微处理器完成复杂任务的行之有效的方澍1 0 H”】。1 2 单芯片多处理器的发展与应用自1 9 9 6 年单芯片多处理器(S i n g l e-C h i pM u l t i n r o c e s s o r s,S C M P)结构【1 4】被提出以来,它一直是微处理器体系结构的一个研究热点。通过较小的软硬件开销提高面向通用程序的单芯片多处理器的性能,是该结构推广应用必须解决的问题。单芯片多处理器的基本思想是:将多个处理器集成在一块芯片上【1 8 1。由S t a n f o r d 大学提出片上多处理器(C M P)结
23、构的思想在他们设计的H y d r a 处理器f H a r e m 2 0 0 0 中实现。C M P 在一块芯片内实现了S M P(对称多处理)架构,且并行执行不同的进程,C M P 可以比超标量处理器更具并行性。当半导体工艺提升至O 1 8 微米以后,线延时已经超过了门延迟,微处理器的设计需要通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于C M P 结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。多处理器还可以在芯片内部共享存储,提高存储器利用率,同时简化并行系统设计的复杂度。在实际应用中,微处理器作为相对独立的模块,各个模块
24、组成一个多微处理器系统,利用一个主处理器进行各模块间的协调与控制,即构成主从式多处理器系统。同时,外围器件或专用加速器中的专用处理器也能够分担主处理器中那些较低级的功能,从而使主处理器能够专注于高级功能的实现。主从式单芯片多处理器也就这样应运而生了【1 5】1 6 1。单芯片多处理器设计非常适用于今天的嵌入式系统,这主要有三个方面的原因。首先,嵌入式应用的功能通常可以灵活地进行分离,因此很容易将其功能映2上海大学硕士学位论文射到多个处理器中。有时,将嵌入式系统的功能分割映射到多个单独的处理器中甚至比映射到一个处理器中更容易。其次,许多嵌入式应用都具备明显的并行性,因而可以用一系列并行处理器来开
25、发【1 9】。【2“。例如,网络处理器(N P U)设计工程师已经利用这个特性开发路由功能。最后一点,随着当今O 1 3 微米和6 5 纳米技术的出现,已经可以以较低的成本实现用单芯片多处理器S o C 系统。可以肯定,在未来的一二十年间,随着制造工艺发展,当芯片容量足够大时,单芯片多处理器结构(S C M P)就可以将大规模并行处理器结构中的对称多处理器(S M P)或分布共享处理器S M)节点集成到同一芯片内,各个处理器并行执行不同的线程或进程。单芯片多处理器结构大大的提高了处理器的性能,针对这种结构的研究是非常必要和有意义的。1 3 本文主要研究工作1 3 1 课题背景机器视觉被称为自动
26、化的眼睛,在国防系统、遥感图像分析、工业视觉、智能机器人、精确制导、安全鉴别、视与跟踪、医学图像、文字指纹染色体识别以及集成电路芯片检测等方面有着广泛的应用,实现设备智能化、自动化、高效化、高精密,机器视觉系统是不可或缺的功能模块【2 3 1。机器视觉的基础是图像理解和分析,是当今世界上最为活跃的学科之一。笔者所进行的“机器视觉及其芯片实现研究”课题用机器视觉分析皮肤显微图像,将皮肤专家的知识、护理意见等构建成皮肤诊断知识库,将经过专家确认的典型皮肤症状构建成样本库,采用机器视觉的理论和技术,结合皮肤专家的临床经验,以知识驱动从图像采集、预处理、分割、特征提取、识别、解释到理解的整个过程,实现
27、皮肤诊断的智能化。采用片上系统(S o C)技术将整个皮肤测试、诊断系统集成在一片芯片上,实现单芯片智能皮肤诊断。在机器视觉这样的高端系统中,会涉及到图像处理和分析,知识的学习,知识库和样本库的建立、自适应学习、升级和管理等,这需要大量的运算、处理,单个传统M C U 并不能胜任这些工作。但如果在指令系统不变的前提下,将应用系统的各个独立的任务调用程序分配到各个从处理器中,使用多个M C U 分别执上海大学硕士学位论文行和管理机器视觉运算、知识库、样本数据库等,就能用低端微处理器执行高端的机器视觉、图像处理的工作。由多个微控制器来共同完成系统任务,将降低对主处理器存储能力和处理强度的要求,并且
28、大大提高系统的并行处理能力和速度。实现将成本相对较低,应用广泛的M C S 5 1 架构微控制器应用于需要大量复杂算法的高端系统中。而低端微控制器的设计和流片,在现有条件下较易实现。基于上述思想,首先要设计一个能进行复杂计算又能进行控制的微处理器,然后以该微控制器为基础,研究一种基于微控制器核的机器视觉系统单芯片多处理器结构的实现方法。1 3 2 实现目标和策略1 目标本文研究一种基于M V-0 3M C UI P 核的机器视觉系统单芯片多处理器的结构实现方法,满足机器视觉系统的大量算法对处理器运算能力和并行工作效率的要求。本设计采用主从多处理器结构,其中主处理器面向用户,执行机器视觉的应用程
29、序,同时负责对整个多处理器系统协同工作的控制;从处理器完成常用机器视觉的图像采集、处理等算法以及数据库管理、知识库管理等任务。2 实现策略要实现上述目标,将模型和算法构建在芯片上,以核的数量弥补性能的不足。笔者设计将机器视觉的处理分解为可并行处理的系列任务,然后把这些任务分配给各个处理器单独处理,从而提高运算的能力和时效。在基于微控制器的机器视觉系统多处理器架构实现方法中,本人设计了一个具有多个处理器的单芯片系统。其中,一个处理器为主处理器面向用户,完全使用微控制器的指令系统,执行目的机器视觉的系统运算和控制:而将机器视觉常用任务算法集成在从处理器中,由其完成常用机器视觉算法,数据库管理、知识
30、库管理等工作,而用户则无需参与从处理器的工作。这样将使应用工程师在图像分析、图像理解层上处理机器视觉的问题,而无需参与对专业要求极高的复杂的机器视觉底层处理,无需接受专业的图像处理、机器视觉训练及机器视觉算法的编程,即可方便地应用机器视觉技术和图像处理技术。在构建的机器视觉片上系统中,用户可以配上特定的知识库和样本库,即可完成具体的功能,如皮肤诊断4上海大学硕士学位论文系统芯片,基因识别系统芯片等。这里提到的命令从处理器执行机器视觉的常用任务算法的方法,在本文中被定义为超级指令任务调用,这是一种基于单芯片多处理器架构下的任务调用的实现方法。此外,系统处理的任务越来越复杂,计算量越来越高,系统功
31、耗增大,芯片发热不容忽视。本设计对多个M C U 的设计实现低功耗技术,即在系统运行时,没有任务的处理器处于复位状态不工作,这样可以降低系统功耗,减少热量,提高性能。虽然本文叙述的具体对象是机器视觉系统,但其实现思想和方法对于片上多处理器系统具有通用性。1 3 3 课题意义本课题是机器视觉及其芯片实现研究的一部分,作为机器视觉系统中高性能单芯片多处理器,需具有实时性、稳定性、低功耗、能处理大量数据和运行复杂程序的功能。本课题设计的一种基于M V-0 3M C UI P 核的单芯片多处理器的架构实现方法,其设计相对复杂,是集成电路设计领域及电子信息领域的一项核心技术。单芯片多处理器中的片上总线设
32、计方案,共享存储器和仲裁器以及任务调用硬件实现等的设计思想,都对单芯片多处理器的设计发展具有很好的参考价值。单芯片多处理器的实现为机器视觉系统的S o C 实现提供了具有自主知识产权的S C M Pl P 核,具有很高的科学研究意义和广泛的市场应用价值。1 3 4 本人工作本人设计的单芯片多处理器架构基于M v 0 3M C UI P 核,用片上总线将多个处理器连接起来,实现了多处理器在单芯片上的协同工作,较好地解决了用低端微处理器实现高端机器视觉处理的问题。本人的主要工作和创新点在于:(1)提出并实现了基于M V-0 3M C UI P 核的单芯片多处理器整体架构设计方案;(2)设计了一种运
33、用于单芯片多处理器架构的片上总线结构,解决了多处理器之间的信息、命令和状态的互传问题;(3)提出了一种超级指令任务调用方法,在单芯片多处理器系统结构中实现了上海大学硕士学位论文主从处理器之间的任务调度和并行工作;(4)提出了一种共享存储器的设计方案,将共享存储仲裁器集成在片上,解决了单芯片上多个处理器对共享数据存储区的访问冲突问题;(5)提出了一套有效的针对单芯片多处理器架构的验证和测试方案,发现了设计中的错误,并且对这些错误给予了修正。本人在完成课题设计的过程中,不仅掌握了数字电路设计方法,而且掌握了一定的m 核及S o C 片上系统的知识和设计方法,同时熟练掌握了一系列E D A工具的使用
34、。并且在单芯片多处理器设计正式开始之前,主导了本设计的单核基础一M V-0 3M C UI P 核在A l t e r a 公司的F P G A 上的验证工作(本文不做详述),对F P G A 的建模、验证和设计实现都有了较深的理解。项目进行的过程中发现和解决了一些问题,积累了一定的m 设计、系统设计和验证调试的实践经验,这些经验为以后设计和验证更多更好的m 核奠定了坚实的基础。1 4 本文架构本文按照整个单芯片多处理器的分析和设计的过程进行组织和编排,从系统整体架构设计到具体的硬件电路设计、系统的仿真验证实现,最后到设计中的不足与展望都进行了较为详细的阐述。全文共分为六章,安排如下:第一章对
35、单芯片多处理器的应用现状及发展趋势进行了综述。概述了本文主要研究的内容、意义及文章的组织结构:第二章介绍了单芯片多处理器的总体架构设计以及片上总线的概念、设计思想和实现方法;第三章结合前文所述的硬件架构的设计介绍了本设计提出的超级指令任务调用的概念、思想、实现方法和工作流程以及设计中遇到的问题和解决方法等:第四章介绍了单芯片多处理器的共享存储器和共享存储仲裁器的设计思想、方法及设计中遇到的问题和解决方法;第五章给出了验证方案和具体的测试方法。最后的仿真结果证明该设计是正确可行的;第六章是全文的总结以及对今后工作的展望。对本设计中还有待进一步研究和展开的工作进行了阐述,并对本课题未来的开发方向进
36、行了探讨。6上海大学硕士学位论文第二章单芯片多处理器(s c M P)的设计和总体概述2 1 单芯片多处理器架构设计随着集成电路的深亚微米制造技术、设计技术的迅速发展集成电路己进入片上系统时代。所谓片上系统,又叫系统级芯片,也就是系统级集成电路,其英文简写为S o C(S y s t e mo na c h i p)。如果说V L S I 促进P C 广泛的应用而带来了信息产业的第一次革命,那么S o C 的发展正在带来信息产业的第二次革命。S O C是在AsI C 的基础上发展起来的电路,具有很多独特的优点【2 4 1:(1)S o C 增加了功能:从单一功能增加到多功能,可完成系统的功能,
37、实现高速、高集成度和低功耗;(2)S o C 大大降低整机成本:由过去的多块I c 构成系统,变成现在的一块S o C;(3)S o C 大大降低整机的体积:这是系统制造商进一步发展的方向,尤其对便携式的电脑、通讯及多媒体产品的生产厂家更具有吸引力;(4)S o C 促进了整机系统更新换代的速度:它缩短了供需双方的差距,整机更受用户的欢迎,易于占领市场。本设计S C M P 以高性能的具有自主知识产权的M v-0 3M C U 口核为基础,在单片上集成了多个处理器,共享存储器仲裁器等,具有高并行性、高运算能力、大存储容量、低功耗等S o C 的特点。2 1 1 单芯片多处理器特点电子系统的复杂
38、性和要求计算能力不断提高的事实促进了多处理器架构的迅速发展。单芯片多处理器结构具有以下几个显著特点【2 5】:(1)控制逻辑简单:相对超标量处理器结构与超长指令字处理器结构而言,单芯片多处理器结构的控制逻辑复杂性明显要低得多;(2)实现相对简单:控制逻辑复杂性的降低相应地使单芯片多处理器结构的硬件实现必然比超标量处理器结构与超长指令字处理器结构简单得多,其实现代价也要低得多;7上海大学硕士学位论文(3)高主频:由于单芯片多处理器结构控制逻辑和硬件实现相对简单,因此在同等工艺条件下,单芯片多处理器结构将获得比超标量处理器结构和超长指令字处理器结构更高的工作频率,其性能也将得到提高:(4)低通信延
39、迟:由于多个处理器集成在一块芯片上,因此相对于分离的多处理器系统而言,单芯片多处理器结构中多个处理器之间的通信延迟要小得多;(5)软件重用:由于结构比较相近因此单芯片多处理器结构能够快捷有效地继承面向传统的多处理器结构开发的各种系统软件和应用软件,而它们经过几十年的发展,在许多应用领域已经相当成熟,特别是在事务处理和科学工程计算领域。因此,当芯片上集成的晶体管数目不断增多的时候,单芯片多处理器结构将是一条提高微处理器性能的有效途径,是目前处理器组织结构研究的热点。2 1 2S C M P 设计的单核基础M v-0 3M C U 介绍M V-0 3M C U 是机器视觉及其芯片实现研究的一部分,
40、作为机器视觉系统中高性能M C U,需具有实时性、稳定性、低功耗、能处理大量数据和运行复杂程序的功能。M V-0 3M C U 是同M C S 5 1 指令系统兼容的8 位微控制器。M V-0 3M C U的主要功能特点如下 2 6 圆】:1)内核具有高性能的指令系统,比如预取指,4 个时钟周期1 个机器周期(一个时钟周期为2 5 M 赫兹),指令集与标准8 0 5 1 相兼容;2)引脚和指令同8 0 5 1 完全兼容。3)支持最大1 6 M B 外部程序存储器及1 6 M B 外部数据存储器:4)两个1 6 位定时计数器;一个全双工串行口;一个看门狗定时器(w D T);5)支持l O 个两
41、级优先级的系统中断源,其中外部中断源多达六个:6)多级复位管理,增加软件强制复位、堆栈溢出复位和看门狗定时器复位,并具复位源查询功能:7)独特的硬件堆栈跟踪功能,堆栈指针s P 在内部R A M 的0 7 H-7 F H 和外部R A M 的0 0 H-F F H 两个区域之间自由切换,使片内片外堆栈区域无缝连接,特别适合大型的应用程序;上海大学硕士学位论文8)提供多达五种工作模式的P M M(P o w e r M a n a g e m e n t M o d e s)正常(N o r m a l)、空闲(I d l e)、掉电(P o w e r-d o w n)、经济1 和经济2(E
42、c o n o m y),特别适合低功耗的运行场合。退出掉电模式可以有两种方法:引脚复位和外部低电平中断唤醒;9 1M O V X 指令周期长度可在3 8 个机器周期内可调。这允许M V-0 3M C U 可与多种类型的片外存储器相匹配;1 0)在兼容M C S 5 1 指令集的基础上,增加了一条D E C D P T R 指令;1 1)可自动递增递减的双D P P(数据指针页寄存器,给出2 4 位数据存储器的最高8 位地址)和双D P T R 功能,特别适合大块数据传送,相比用单D P T R 进行数据块操作约有4 0 的速度提升。2 1 3S C M P 整体架构及特点单芯片多处理器的设计
43、以M V-0 3I P 核为基础,参考现有片上总线技术,设计了一种片上总线方案,在每个处理器中都新增片上总线接口模块,通过片上总线将一个主处理器和三个从处理器连接在单个芯片上。单芯片多处理器架构总览见图2 1。其中主处理器,负责整个系统的运作、管理和调度。从处理器根据需要承担不同的任务(例如在机器视觉系统中,可以安排从处理器l 负责机器视觉的处理;从处理器2 负责自学习,知识库的管理和更新;从处理器3 负责样本库的管理、更新和扩充)。每个处理器仍然保有M V-0 3单核的所有功能,指令系统也与其完全兼容。每个处理器的数据空间为1 6 M。但考虑到如果各个处理器之间的大量数据交互通过同一数据总线
44、传送将占用大量的总线资源,降低系统工作速度。因此,在1 6 M 的数据地址空间中,将其中的4 M 空间作为共享数据存储空间。每个处理器都可以访问这4 M 的空间,共享资源的访问冲突由一个集成在片上的共享存储的仲裁器来解决。每个处理器的程序寻址空间也是1 6 M,其中各有1 M 的空间开辟为屏蔽区(在3 2 1 中详述)。设计的一种超级指令任务调用方法,对单核内部部分模块进行重新设计,结合新增的总线接口模块,在保留所有单核自身功能和指令系统的前提下,使得整个多处理器的任务调用工作由硬件自动完成,而对于用户来说并没用增加使用的复杂度。9上海大学硕士学位论文图2-1 单芯片多处理器架构总览本设计S
45、C M P 的主要功能特点如下:1)以M V-0 3M C UI P 软核为基础,保留上节所述M V-0 3M C U 的全部功能和特性;2)指令集与单核M V-0 3 完全一致,包括相对M C S 5 1 系统新增的D E CD P T R 和双指针指令功能;多处理器的协作由硬件完成,而不需要另外增加新的专用指令;3)四个相对独立的微控制器通过一种有效的片上总线连接,其中主处理器负责应用程序和对从处理器的控制;从处理器在其自身的程序存储区中存放专业性强的相对独立的任务调用程序,等待主处理器的任务;4 1 主处理器向从处理器发送的命令本设计中称为超级指令(超级指令的概念将在第三章中详述),它是
46、一个8 位的数据。相应的从处理器根据超级指令了解到主处理器的命令要求,自动始执行该任务。而主处理器在发送完命令之后,就可以继续其它工作或向其它从处理器发送其它命令,从而实现多处理器的并行工作,提高系统工作的并行性和效率:5)每一个处理器自身都支持最大1 6 M B 程序存储器(外部R O M)及1 2 M B数据存储器(外部R A M),大大提高了8 位多处理器处理和运行大量数据和复杂程序的能力;1 0上海大学硕士学位论文6)除了自己的1 2 M 数据存储区外,每个处理器还可以访问4 M 的共享数据存储空间;设计的片上共享存储仲裁器可以解决其访问冲突问题;7 1 除M V-0 3 单核本身的低
47、功耗设计,如掉电、空闲、经济等,设计的单芯片多处理器中从处理器在未被调用时指针始终复位在0 0 0 0 0 0 H 处,即等待任务时内部不工作,从而达到省电的目的,降低整个系统的功耗。2 1 4S C M P 架构自低向上层次化设计在数字I C 设计中,自底向上的设计方法是一种传统的电子系统设计方法。这种方法在设计中首先根据系统要求编制技术规格书,并画出系统控制流程图:然后依照技术规格书和系统控制流程图,对系统的功能进行细化和电路设计。当各功能模块电路设计,调试完成后,将各功能模块连接起来进行系统的全面调试。自底向上的设计方法的优点是:设计人员对于用这种设计方法进行设计比较熟悉,而且实现各个子
48、块电路所需的时间短。本设计中单芯片多处理器的单核基础M V-0 3 也是按照自底向上的设计方法,并已经分别通过E D A 软件和F P G A 硬件仿真,验证了其设计的正确性。在单核的基础上,再展开多处理器系统的设计。首先,在单处理器的基础上,继续在每个处理器中增加片上总线接口模块,增强了口核的复用性;在顶层模块增加了共享存储器仲裁器模块,以及为程序指针和指令寄存器等模块进行了进一步的设计和改进,增加了单芯片多处理器需要的各项功能。单芯片多处理器设计中增加和改进的各个模块也各自通过仿真,验证了设计的正确性。在这些功能模块底层设计完成后,进行各个单核模块的整合,包括各个被划分后单独设计好的功能模
49、块、片内R A M 的接口模块、片上总线接口模块等之间的连接,这是一个单核次顶层文件,四个单核次顶层文件分别定义为M V-0 3 w a r p _ M O V,M V-0 3 w a r pS 1 v,M V-0 3 w a r p _ S 2 V 和M V-0 3 w a r p _ S 3 V 文件。其中M V-0 3 w a r p各个功能模块,包括主处理器片上总线接1 3 模块,主处理器的程序指针模块等。同样,M V-0 3 w a r pv等文件中也分别实例化了各从处理器的各个功能模块。S1这四个处理器的大部份功能模块可以复用同一个模块设计,避免了重复设计。只上海大学硕士学位论文有
50、总线接口模块,程序指针模块,指令寄存器模块等这些涉及到不同处理器不同功能的模块在相应单核次顶层文件中的实例化是不同的。各个次顶层模块要实例化其相应的功能模块。单核次顶层模块的结构如图2 2。图中涉及到多处理器功能的模块,如多处理器片上总线接口模块、程序指针模块、指令寄存器模块等的设计将在下文中分别阐述,其它模块是M V-0 3 中的各种功能模块,详见参考文献 2 6 1。这些功能模块设计都可以被多个处理器复用。图2-2M V-0 3 处理器单核次项层结构各个单核次顶层模块在实例化各个功能模块的时候要注意其互连关系,它们之间的连线要定义成w i r e 类型。在各个功能模块相连接的信号和数据作为