汇编语言程序设计DSP技术与应用实例第3版.ppt-淘文阁

资源描述

《汇编语言程序设计DSP技术与应用实例第3版.ppt》由会员分享，可在线阅读，更多相关《汇编语言程序设计DSP技术与应用实例第3版.ppt（35页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第第6章章汇编语言程序设计汇编语言程序设计6.1程序的控制与转移TMS320C54x具有丰富的程序控制与转移指令，利用这些指令可以执行分支转移、循环控制及子程序操作。基本的程序控制指令如表6-1所示。表6-1基本的程序控制指令分支分支转转移指令移指令执执行周期行周期子程序子程序调调用指令用指令执执行周期行周期子程序返回指令子程序返回指令执执行周期行周期B next 4BACC src 6BC next,cond 5/3CALL sub 4CALA src 6CC sub,cond 5/3RET 5RC cond 5/31条件算符条件分支转移指令或条件调用、条件返回指令都用条件来限制分

2、支的转移、调用和返回操作。条件算符分成两组，每组组内还有分类。第1组：EQNEQLEQGEQLTGTOVNOV第2组：TCNTCCNCBIONBIO选用条件算符时应当注意以下3点:第1组：组内两类条件可以进行与/或运算，但不能在组内同一类中选择两个条件算符与/或。当选择两个条件时，累加器必须是同一个。例如，可以同时选择AGT和AOV，但不能同时选择AGT和BOV。第2组：可从组内3类算符中各选一个条件算符与/或，但不能在组内同一类中选两个条件算符与/或。例如，可以同时测试TC、C和BIO，但不能同时测试NTC和TC。组与组之间的条件只能进行或运算。2循环操作BANZ在程序设计时，经常需要重复执

3、行某段程序，利用BANZ（当辅助寄存器不为0时转移）指令执行循环计数和操作是十分方便的。SUM:STM#x,AR3 STM#4,AR2loop:ADD *AR3+,A ;程序存储器 BANZ loop,*AR2-STL A,y3比较操作CMPR编程时，经常需要数据与数据进行比较，这时利用比较指令CMPR是很合适的。CMPR指令测试所规定的AR寄存器（AR1AR7）与AR0的比较结果。如果所给定的测试条件成立，则TC位置1，然后，条件分支转移指令就可根据TC位的状态进行分支转移了。注意，所有比较的数据都是无符号操作数。STM#5,AR1STM#10,AR0loop:.*AR1+.CMPRLT,A

4、R1BCloop,TC6.2堆栈的使用方法TMS320C54x提供一个用16位堆栈指针（SP）寻址的软件堆栈。当向堆栈中压入数据时，堆栈从高地址向低地址增长。堆栈指针是减在前、加在后，即先SP1再压入数据，先弹出数据后SP+1。如果程序中要用到堆栈，则必须先进行设置，方法如下：size.set100stack.usectSTK，sizeSTM#stack+size，SP上述语句在数据RAM空间开辟一个堆栈区。前两句在数据RAM中自定义一个名为STK的保留空间，共100个单元。第3句将这个保留空间的高地址（#stack+size）赋给SP，作为栈底，参见图6-1。至于自定义未初始化段STK究竟定

5、位在数据RAM中的什么位置，应当在链接器命令文件中规定。数据存储器0STK堆栈的设置sizeset100stackusectSTK，sizeSTM#stack+size，SP堆栈的用法压入操作：SP先减1后，再将数据压入堆栈中弹出操作：数据弹出后，再将SP加1stack可用栈区SP最后用的单元已用栈区65535图6-1堆栈设置堆栈之后，就可以使用堆栈了，例如：CALLpmad；(SP)-1SP，(PC)+2TOS；pmadPCRET；(TOS)PC，(SP)+lSP堆栈区应开辟多大？这需要按照以下步骤来确定:先开辟一个大堆栈区，且用已知数填充。运行程序，执行所有的操作。暂停，检查堆栈中的数值如

6、下图。用过的堆栈区才是实际需要的堆栈空间。1.加减法【例6-4】计算z=x+yw。SUMB:LD x,AADD y,ASUB w,ASTL A,zRET.end计算结果：数据寄存器地址存储内容十进制数x0060H000AH10y0061H001AH26w0062H0017H23z0063H000DH136.3加减法运算和乘法运算2.乘法【例6-5】计算y=mx+b。SU:LD m,TMPY x,AADD b,ASTL A,yRET.end计算结果：数据寄存器地址存储内容十进制数m0060H0003H3x0061H000FH15b0062H0014H20y0063H0041H656.4重复操作1

7、重复执行单条指令重复指令RPT或RPTZ允许重复执行紧随其后的那一条指令。如果要重复执行n次，则重复指令中应规定计数值为n1。由于重复的指令只需要取指一次，与利用BANZ指令进行循环相比，效率要高得多。【例6-9】对数组x50,0,0,0,0进行初始化。.bss x,5或者STM#x,AR1LD#0H,ARPT#4STL A,*AR1+或者.bss x,5STM#x,AR1RPTZ#4STL A,*AR1+2块程序重复操作块程序重复操作RPTB将重复操作的范围扩大到任意长度的循环回路。由于块程序重复指令RPTB的操作数是循环回路的结束地址，而且，其下条指令就是重复操作的内容，因此必须先用S

8、TM指令将所规定的迭代次数加载到块重复计数器（BRC）中。RPTB指令的特点是：对任意长度的程序段的循环开销为0，其本身是一条2字4周期指令；循环开始地址（RSA）是RPTB指令的下一行，结束地址（REA）由RPTB指令的操作数规定。【例6-10】对数组x5中的每个元素加1。.bss x,5start:LD#1,16,B STM#4,BRC STM#x,AR4 RPTB next-1 ADD *AR4,16,B,A STH A,*AR4+next:LD#0,B3循环的嵌套2nd:1st:STM#L1,AR7;2T外部STM#M1,BRC;2TRPTB2nd1;4T中间中间RPT#N1;1T内部

9、中间中间外部外部BANZ1st,*AR7;4T312 执行RPT指令时要用到RPTC寄存器（重复计数器），执行RPTB指令时要用到BRC、RSA和RSE寄存器。由于两者用了不同的寄存器，因此RPT指令可以嵌套在RPTB指令中，实现循环的嵌套。当然，只要保存好有关的寄存器，RPTB指令也可以嵌套在另一条RPTB指令中，但效率并不高。下图是一个三重循环嵌套结构，内层、中层和外层三重循环分别采用RPT、RPTB和BANZ指令，重复执行N、M和L次。6.5数据块传送这些指令的特点如下：（1）传送速度比加载和存储指令的速度要快；（2）传送数据不需要通过累加；（3）可以寻址程序存储器；（4）与RPT指令相

10、结合，可以实现数据块传送。数据存数据存储储器器数据存数据存储储器器#W/C数据存数据存储储器器MMR#W/CMVDKSmem,dmadMVKDdmad,SmemMVDDXmem,Ymem2/22/21/1MVDMdmad,MMRMVMDMMR,dmadMVMMmmr,mmr2/22/21/1程序存程序存储储器器数据存数据存储储器器#W/C程序存程序存储储器（器（AccAcc）数据存数据存储储器器#W/CMVPDPmad,SmemMVDPSmem,Pmad2/32/4READASmemWRITASmem1/51/51程序存储器数据存储器【例6-11】初始化数组x5=1,2,3,4,5。.titl

11、e zh9.asm .mmregsSTACK.usect STACK,10H .bss x,5 .datatable:.word 1,2,3,4,5 .def start .textstart:STM#x,AR1 RPT#4 MVPD table,*AR1+end:B end .end2数据存储器数据存储器【例6-12】编写一段程序，将数据存储器中数组x20中的数据复制到数组y20中。.title zh10.asm .mmregsSTACK.usect STACK,30H .bss x,20 .bss y,20 .datatable:.word 1,2,3,4,5,6,7,8,9,10,11,

12、12,13,14,15,16,17,18,19,20 .def start .textstart:STM#x,AR1 RPT#19 MVPD table,*AR1+；从程序存储器传送到数据存储器中 STM#x,AR2 STM#y,AR3 RPT#19 MVDD *AR2+,*AR3+；从数据存储器传送到数据存储器中end:B end .end20个数据从0060H0073H传送到0074H0087H，结果如图所示：6.6双操作数乘法TMS320C54x片内的多总线结构，允许在一个机器周期内通过两条16位数据总线（C总线和D总线）寻址两个数据和系数，如图6-6所示。数据存储器乘法器/加法器累加器

13、A累加器BC总线D总线图6-6 双操作数乘法如果求y=mx+b，则单操作数和双操作数实现方法比较如表6-4所示：表表6-4 单单/双操作数编程比较双操作数编程比较用双操作数指令编程的特点为：（1）用间接寻址方式获得操作数，且辅助寄存器只能用AR2AR5；（2）占用的程序空间小；（3）运行的速度快。单单操作数方法操作数方法双操作数方法双操作数方法LD m，TMPY x，AADD b，ASTL A，yMPY *AR2，*AR3，AADD b，ASTL A，y双操作数MAC型的指令有4种，如表6-5所示：表表6-5 MAC型双操作数指令型双操作数指令对于Xmem和Ymem，只能用以下辅助寄存器及寻址

14、方式：辅助寄存器AR2 寻址方式*ARn AR3 *ARn+AR4 *ARn AR5 *ARn+0%指指令令功功能能MPY Xmem,Ymem,dstMAC Xmem,Ymem,src,dstMAS Xmem,Ymem,src,dstMACP Smem,Pmad,src,dstdst=Xmem*Ymemdst=src+Xmem*Ymemdst=src-Xmem*Ymemdst=src+Smem*Pmad6.7长字运算和并行运算1长字指令DLD Lmem，dst ;dst=LmemDST src，Lmem ;Lmem=srcDADD Lmem，src，dst ;dst=src+LmemDSU

15、B Lmem，src，dst ;dst=src-LmemDRSUB Lmem，src，dst ;dst=Lmem-src（1）偶地址排列法（2）奇地址排列法数据存储器偶地址：xhi奇地址：xlo程序存储器偶地址：1234奇地址：5678.long 1 2 3 4 5 6 7 8 h 变量名称字长页邻接偶地址排列法.bss xhi,2,1,1图6-8 奇偶地址排列规定【例6-15】计算Z32=X32+Y32。标准运算 .title zh16.asm .mmregsSTACK.usect STACK,10H .bss xhi,1 .bss xlo,1 .bss yhi,1 .bss ylo,1 .

16、bss zhi,1 .bss zlo,1 .def start .datatable:.word 1678H,2345H .word 1020H,0D34AH .text start:STM#0,SWWSR STM#STACK+10H,SP STM#xhi,AR1 RPT#3 MVPDtable,*AR1+LD xhi,16,A ADDS xlo,A ADD yhi,16,A ADDS ylo,A STH A,zhi STL A,zloend:B end .end(6个字，6个T)长字运算.title zh17.asm .mmregsSTACK.usect STACK,10H .bss xhi

17、,2,1,1 .bss yhi,2,1,1 .bss zhi,2,1,1 .def start .datatable:.long 16782345H,1020D34AH .text start:STM#0,SWWSR STM#STACK+10H,SP STM#xhi,AR1 RPT#3 MVPD table,*AR1+DLD xhi,A DADD yhi,A DST A,zhiend:B end .end (3个字，3个T)2并行运算并行运算指令举例并行运算指令举例指指令令举举例例操作说明操作说明LD|MACRLD|MASRLDXmem，dst|MACRYmem，dst2dst=Xmem(

18、16-ASM)dst=Xmem(16-ASM)dst=dst+T*XmemST|ADDST|SUBSTsrc，Ymem|ADDXmem，dstYmem=src(16-ASM)dst=dst+Xmem【例6-16】用并行运算指令编写计算z=x+y和f=e+d的程序。.mmregsSTACK .usect STACK,10H .bss x,3 .bss d,3 .def start .datatable:.word 0123H,1027H,0,1020H,0345H,0 .text start:STM#0,SWWSR STM#STACK+10H,SP STM#x,AR1 RPT#5 MVPD ta

19、ble,*AR1+STM#x,AR5 STM#d,AR2 LD#0,ASM LD *AR5+,16,A ADD *AR5+,16,A ST A,*AR5 ;并行指令|LD *AR2+,B ADD *AR2+,16,B STH B,*AR2end:B end .end364位加法和减法运算64位数的加法和减法算式如下：w3 w2w1 w0(W64)+x3 x2Cx1 x0(X64)低32位相加产生进位C-y3 y2Cy1 y0(Y64)低32位相减产生借位Cz3 z2z1 z0(Z64)例6-17编写计算Z64=W64+X64-Y64的程序。W、X、Y和结果Z都是64位数，它们都由两个32位的长

20、字组成。利用长字指令长字指令可以完成64位数的加减法。DLDw1,A;A=w1w0DADDx1,A;A=w1w0+x1x0,产生进位CDLDw3,B;B=w3w2ADDCx2,B;B=w3w2+x2+CADDx3,16,B;B=w3w2+x3x2+CDSUBy1,A;A=w1w0+x1x0-y1y0,产生借位CDSTA,z1;z1z0=w1w0+x1x0-y1y0SUBBy2,B;B=w3w2+x3x2+C-y2-CSUBy3,16,B;B=w3w2+x3x2+C-y3y2-CDSTB,z3;z3z2=w3w2+x3x2+C-y3y2-C数据计算结果432位乘法运算32位乘法算式如下：x1 x

21、0 S U y1 y0 S U x0 y0 UU y1 x0 SU x1 y0 SUy1 x1 SSw3 w2 w1 w0 S U U U其中，S带符号数，U无符号数。由上算式可见，在32位乘法运算中，实际上包括三种乘法运算：UU，SU及SS。一般的乘法运算指令都是两个带符号数相乘，即SS。所以，在编程时，还要用到以下两条乘法指令：MACSUXmem，Ymem，src；无符号数与带符号数相乘并累加；src=U(Xmem)S(Ymem)+srcMPYUSmem，dst；无符号数相乘；dst=U(T)U(Smem)例6-18编写计算W64=X32Y32的程序。32位乘法实现的64位乘积的程序如下：

22、STM#x,AR2STM#y,AR3LD*AR2,T;T=x0MPYU*AR3+,A;A=ux0uy0STLA,w0;w0=ux0uy0LDA,-16,A;A=A16MACSU*AR2+,*AR3-,A;A+=y1ux0MACSU*AR3+,*AR2,A;A+=x1uy0STLA,w1;w1=ALDA,-16,A;A=A16MAC*AR3,*AR2,A;A+=x1y1STLA,w2;w2=A的低16位STHA,w3;w3=A的高16位6.8小数运算1小数的表示方法TMS320C54x采用2的补码表示小数，其最高位为符号位，数值范围为1+1。一个16位的2的补码小数（Q15格式）的每一位的权值为

23、：MSB LSB-1 2-1 2-2 2-3 2-15一个十进制小数乘以32768之后，再将其十进制整数部分转换成十六进制数，就能得到这个十进制小数的2的补码表示，例如：1 7FFFH 0.5 正数：乘以32768 4000H 0 0000H-0.5 负数：其绝对值部分乘以32768，再取反加1 C000H -1 8000H在汇编语言程序中，是不能直接写入十进制小数的。若要定义一个系数0.707，可以写成：.word 32768*707/1000.word 32768*707/1000，不能写成32768*0.707。2小数乘法与冗余符号位 0 1 0 0 （0.5）1 1 0 1 (-0.3

24、75)0 1 0 0 0 0 0 0 0 1 0 0 1 1 0 0 (-0100)1 1 1 0 1 0 0 (-0.1875)一个小数乘法的例子(假设字长4位，累加器8位)：上述乘积是7位，当将其送到累加器时，为保持乘积的符号，必须进行符号位扩展，这样，累加器中的值为11110100（-0.09375)，出现了冗余符号位。原因是：S x x x (Q3格式)S y y y (Q3格式)S S z z z z z z (Q6格式)即两个带符号数相乘，得到的乘积带有2个符号位，造成错误的结果。解决冗余符号位的办法解决冗余符号位的办法：在程序中设定状态寄存器ST1中的FRCT（小数方式）位为1，

25、在乘法器将结果传送至累加器时就能自动地左移1位，累加器中的结果为：Szzzzzz0(Q7格式)，即11101000(0.1875)，自动地消去了两个带符号数相乘时产生的冗余符号位。在小数乘法编程时，应当事先设置FRCT位如下：SSBX FRCTMPY *AR2，*AR3，ASTH A，Z 这样，TMS320C54x就完成了Q15Ql5=Q15的小数乘法。6.9除法运算1被除数的绝对值小于除数的绝对值，商为小数在一般的DSP中都没有除法器硬件。因为除法器硬件代价很高，所以就没有专门的除法指令。同样，在TMS320C54x中也没有一条单周期的16位除法指令。但是，利用条件减法指令

26、（SUBC指令），加上重复指令“RPT#15”，就可实现两个无符号数的除法运算。条件减法指令的功能如下：SUBC Smem，src 2被除数的绝对值大于等于除数的绝对值，商为整数6.10浮点运算1浮点数的表示方法在TMS320C54x中，浮点数由尾数和指数两部分组成，它与定点数的关系如下：定点数=尾数2（指数）例如，定点数0 x2000(0.25)用浮点数表示时，尾数为0 x4000(0.5)，指数为1，即0.25=0.521浮点数的尾数和指数可正可负，均用补码表示。指数的范围为831。2定点数到浮点数的转换TMS320C54x通过3条指令可将一个定点数转化成浮点数:（1）EXP A（2）ST

27、 T，EXPONENT（3）NORMA3浮点数到定点数的转换知道TMS320C54x浮点数的定义后，就不难将浮点数转换成定点数了。因为浮点数的指数就是在规格化时左移（指数为负时是右移）的位数，所以在将浮点数转换成定点数时，只要按指数值将尾数右移（指数为负时是左移）就行了。4浮点乘法举例【例6-26】编写浮点乘法程序，完成x1x2=0.3(0.8)运算。程序中保留10个数据存储单元：x1：被乘数m2：乘数的尾数x2：乘数ep：乘积的指数e1：被乘数的指数mp：乘积的尾数ml：被乘数的尾数product：乘积e2：乘数的指数temp：暂存单元程序清单如下：.titlezh24.asm.mmreg

28、s.defstartSTACK.usectSTACK,100;64H.bssx1,1.bssx2,1.bsse1,1.bssm1,1.bsse2,1.bssm2,1.bssep,1.bssmp,1.bssproduct,1.bsstemp,1.datatable:.word3*32768/10;0.3.word-8*32768/10;-0.8.textstart:STM#STACK+100,SP;设置堆栈指针MVPDtable,x1;将x1和x2传送至数据存储器MVPDtable+1,x2LDx1,16,A;将x1规格化为浮点数EXPASTT,e1;保存x1的指数NORMASTHA,m1;保存

29、x1的尾数LDx2,16,A;将x2规格化为浮点数EXPASTT,e2;保存x2的指数NORMASTHA,m2;保存x2的尾数CALLMULT;调用浮点乘法子程序end:BendMULT:SSBXFRCTSSBXSXMLDe1,A;指数相加ADDe2,ASTLA,ep;乘积指数epLDm1,T;尾数相乘MPYm2,A;乘积尾数在累加器A中EXPA;对尾数乘积规格化STT,temp;规格化时产生的指数tempNORMASTHA,mp;保存乘积尾数在mp中LDtemp,A;修正乘积指数ADDep,A;(ep)+(temp)epSTLA,ep;保存乘积指数在ep中NEGA;将浮点乘积转换成定点数STLA,temp;乘积指数反号，并且加载到T寄存器LDtemp,T;再将尾数按T移位LDmp,16,ANORMASTHA,product;保存定点乘积RET.end

展开阅读全文