《09第9章 语义分析和代码生成.ppt》由会员分享,可在线阅读,更多相关《09第9章 语义分析和代码生成.ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第9 9章章 语义分析和代码生成语义分析和代码生成 9.1 语义分析的概念语义分析的概念程序语言是用上下文无关文法描述的。在语法分析中,我们严格按文法来检查语句的语法是否正确,但有些语句,单看语法结构并没有错误,但和该语句所处的上下文联系考虑就有错误,那么,我们把这种错误就称为语义错误。语义分析就是处理这种语义错误。考虑下段程序:1.inta;2.intb;3.reala;4.d=a+b;5.第3行语句reala,c;为声明语句,单看这一行没有语法错误,但和上一行语句比较,发现变量a属于重复定义。第4行语句为表达式语句,单看这一行也没有错误,但查询前面的声明语句,发现变量d没有声明。因此,我
2、们可看到语句的正确与否还与上下文密切相关。第第9 9章章 语义分析和代码生成语义分析和代码生成 语义分析主要借助符号表记录的信息来实现语义分析动作。常见的语义分析动作有:1)对表达式中的操作数进行类型的一致性检查。对于强类型语言,要求表达式中的各个操作数、赋值语句左部的变量和右部的表达式的类型应该相同;若不相同则报告语义错误,并要求程序员作显式转换。对于无此项要求的语言,编译程序也要进行类型检查,当发现类型不一致时,则自动作相应的类型转换。2)语义分析的另一个重要功能是要分析由语法分析所识别出来的语句的意义并作相应的语义处理。例如,对声明语句,用户通过这类语句声明程序中要使用的变量,并说明其种
3、类和类型等特性。语义分析程序就要将变量名及其有关属性填入符号表,以备后面使用。对于程序中的可执行语句,则要根据该语句的语义生成相应的中间代码或目标代码。9.2 9.2 中间代码中间代码 源程序的中间形式(也称中间代码)是在编译程序将高级语言程序翻译为汇编语言或机器代码的过程中产生的,在编译过程中起着桥梁的作用。如果不使用中间代码,若有M种语言要在N种机器上运行,则需要编制M*N套编译程序;而如果采用中间代码,则只需编制M+N套编译程序。使用中间代码有如下优点:1)在生成中间代码时,可以不考虑机器的特性,使得编制生成中间代码的编译程序变得较为简单。2)由于中间代码形式与具体机器无关,所以,生成中
4、间代码的编译程序很方便地被移植到别的机器上,只需为该中间代码开发一个解释器或者将中间代码翻译为目标机指令就能在目标机上运行。3)在中间代码上更便于做优化处理。4)使用中间代码的主要缺点是编译的效率比直接产生机器码编译的效率要低一些。中间代码的选择也是一个重要的研究课题。人们期望能找到这样的一种中间语言,它即适合于将各种高级程序设计语言翻译成这种中间语言,又能比较方便地将这种中间语言翻译成各种类型机器的目标语言。目前,中间代码有很多种,下面介绍几种常见的中间代码。9.2.19.2.1波兰后缀表示波兰后缀表示 波波兰兰后后缀缀表表示示是是使使用用较较早早并并且且流流行行至至今今的的一一种种中中间间
5、代代码码形形式式。对对于于波波兰兰后后缀缀表表达达式式,处处理理起起来来比比较较容容易易。在在将将中中缀缀表表达达式式转转换换成成波波兰兰后后缀缀表表示示的的算算法法中中,设设置置一一个个操操作作符符栈栈,当当扫扫描描到到操操作作数数时时,就就立立即即输输出出该该操操作作数数。当当遇遇到到操操作作符符时时,则则要要与与栈栈顶顶操操作作符符比比较较其其优优先先级级,若若栈栈顶顶操操作作符符优优先先级级高高于于栈栈外外操操作作符符,则则输输出出该该栈栈顶顶操操作作符符;反反之之,则则栈栈外外操操作作符符入入栈栈。而而对对于于赋赋值值表表达达式式,只只需需定定义义赋赋值值操操作作符符“=”的的优优先
6、先级级低低于于可可在在表表达达式式中中出出现现的的其其他他操操作作符符,那那么么可可使使用同一算法将其转换成波兰后缀表示。用同一算法将其转换成波兰后缀表示。例如,对于算术表达式例如,对于算术表达式 F*3.1416*R*(H+R)可转换成波兰后缀表示:可转换成波兰后缀表示:F3.1416*R*HR+*对于赋值表达式:对于赋值表达式:S=F*3.1416*R*(H+R)可转换为:可转换为:SF3.1416*R*HR+*=9.2.19.2.1波兰后缀表示波兰后缀表示波波兰兰后后缀缀表表示示除除可可用用来来表表示示表表达达式式类类的的语语言言结结构构以以外外,也也能能够够通通过过操操作作符符的的扩扩
7、充充来来表表示示其其他他的的语语言言结结构构。增增加加相相应应的的操操作作符符就就可可以以表表示示条条件件转转移、下标变量语法单位的语言结构。移、下标变量语法单位的语言结构。例如,条件语句:例如,条件语句:if then else 可转换成波兰后缀表示:可转换成波兰后缀表示:BZBR在该波兰表示中,引入了在该波兰表示中,引入了BZBZ和和BRBR结构。结构。BZBZ是二目操作符,如果是二目操作符,如果 的的计算结果为计算结果为0(0(false)false),则产生到则产生到 label1的转移,而的转移,而 label1是是 stmt2的入口地址。的入口地址。BRBR则是一个单目操作符,它产
8、生到则是一个单目操作符,它产生到 label2的转移,而的转移,而 label2是一个紧跟在是一个紧跟在 stmt2后面的语句的入口地址。后面的语句的入口地址。9.2.2 9.2.2 N-N-元表示元表示 N-元表示是一种常见的中间代码形式。N-元表示中,每一条指令由n个域所组成。第一个域说明操作符,剩下的n-1个域则用来表示操作数。可以将N-元表示的标准格式翻译为寄存器机器的代码,因为在该表示中,操作数常常是作为某些前步计算的结果列出的。N-元表示中最常见的有三元式和四元式。1、三元式三元式三元式的每条指令只有3个域。如算术表达式X+Y,可用一个三元式(+,X,Y)来描述。三元式的第一个域是
9、操作符(+),第二和第三个域分别是两个操作数(Y和Z)。三元式的缺点是优化较困难。三元式的一般表示如下:,例如,表达式W*X+(Y+Z)可用如下三元式序列表示:(1)*,W,X(2)+,Y,Z(3)+,(1),(2)9.2.2 9.2.2 N-N-元表示元表示对三元式序列中的每一个三元式都编上号码,且对前面三元式的计算结果的引用可用在括号内加上三元式的编号来表示。例如,条件语句if(XY)Z=X;elseZ=Y+1;可以用如下三元式序列表示:(1),X,Y(2)BMZ,(1),(5)(3)=,Z,X(4)BR,(7)(5)+,Y,1(6)=,Z,(5)(7)其中,操作符BMZ和BR分别表示零转
10、移和无条件转移。9.2.2 9.2.2 N-N-元表示元表示2、四元式、四元式四元式是另一种N-元表示。该表示法的形式如下:,其中,和是运算数;表示操作符操作的结果,该结果通常是一临时变量,在以后可以由编译程序分配给一个寄存器或者一个主存地址。四元式的优点是便于进行优化处理。例如,表达式(A+B)*(C+D)-E能够由下列四元式序列表示:+,A,B,T1+,C,D,T2*,T1,T2,T3-,T3,E,T4上面四元式序列中,T1、T2、T3和T4均是临时变量。9.2.2 9.2.2 N-N-元表示元表示3、抽象机代码、抽象机代码编译程序设计的重点是要开发出可移植又适用的编译程序。一种方法是使编
11、译程序产生一种作为源程序中间形式的抽象机的代码。而该抽象机的指令应当尽可能模仿所编译的源语言的结构,且具备下列特点:可移植性可移植性:如果花很小的代价,就能将一个程序移植到另一台机器上,那么称该程序是可移植的。移植的开销在本质上要小于当初编制程序时的开销。可适应性可适应性:如果一个程序能够容易地进行修改就能满足不同的用户和系统的需求,那么称该程序是可适应的。假定需要将一个给定的编译程序从X机移植到Y机,为了实现这种移植,需要产生Y机的代码,所以,必须重写现有编译程序的代码生成程序。如果原来的编译程序已分成两部分,而且这两部分之间定义有良好接口,那么完成改写的任务将是很容易的。第一部分(前端)分
12、析源语言,第二部分(后端)处理目标机。如果在前后端之间有一个良好的接口,那么移植的主要工作仅仅是改变目标机部分。一种较理想的接口形式是汇编程序。编译程序两部分之间的信息流在一端为源语言结构形式,在另一端为目标机信息。两者的接口能够通过抽象机来实现,即能够将源语言的各种语法结构映射到该抽象机的伪操作上。9.2.2 9.2.2 N-N-元表示元表示对每一种特定的高级程序设计语言都可以为其设计抽象机。构建抽象机模型的基本原则如下:1)与源语言的操作和数据的良好对应与源语言的操作和数据的良好对应:根据源语言中的原始操作和数据模式来建立抽象机模型。编译程序的前端将源程序中的每一个原始操作和原始数据模式翻
13、译成抽象机指令。所以,抽象机的原始操作应该与组成源程序的最简单和最直接的操作语句相对应;另外抽象机的原始数据模式也应该能与源语言中的最简单的数据类型,或是更复杂的数据模式建立起对应关系。2)在目标机上的高效实现在目标机上的高效实现:抽象机的伪操作能够迅速转换成目标机的机器指令。3)虚拟体系结构虚拟体系结构:需要为抽象机体系构建一个运行环境,以便在该环境中模拟语言的数据模式和操作的相互作用。9.2.3 9.2.3 栈式抽象机及其汇编指令栈式抽象机及其汇编指令 为了提高可读性、简化代码生成过程,我们的目标平台所采用的机器是一台抽象的栈式计算机,它用一个栈来保存操作数,并有足够的内存空间,该抽象机的
14、常用汇编指令如下:LOADD将D中的内容加载到操作数栈。LOADI常量将常量压入操作数栈STOD将操作数栈栈顶单元内容存入D,且栈顶单元内容保持不变。STID将操作数栈栈顶单元内容存入D,且栈顶单元出栈。ADD将次栈顶单元与栈顶单元内容出栈并相加,和置于栈顶。SUB将次栈顶单元减去栈顶单元内容并出栈,差置于栈顶。MULT将次栈顶单元与栈顶单元内容出栈并相乘,积置于栈顶。DIV将次栈顶单元与栈顶单元内容出栈并相除,商置于栈顶。BRlab无条件转移到labBRFlab检查栈顶单元逻辑值,若为假(0)则转移到labEQ将栈顶两单元做等于比较,并将结果真或假(1或0)置于栈顶9.2.3 9.2.3 栈
15、式抽象机及其汇编指令栈式抽象机及其汇编指令NOTEQ将栈顶两单元做不等于比较,并将结果真或假(1或0)置于栈顶GT次栈顶大于栈顶操作数,则栈顶置1,否则置0LES次栈顶小于栈顶操作数,则栈顶置1,否则置0GE次栈顶大于等于栈顶操作数,则栈顶置1,否则置0LE次栈顶小于等于栈顶操作数,则栈顶置1,否则置0AND将栈顶两单元做逻辑与运算,并将结果真或假(1或0)置于栈顶OR将栈顶两单元做逻辑或运算,并将结果真或假(1或0)置于栈顶NOT将栈顶的逻辑值取反IN从标准输入设备(键盘)读入一个整型数据,并入操作数栈OUT将栈顶单元内容出栈,并输出到标准输出设备上(显示器)STOP停止执行9.2 9.2
16、栈式抽象机及其汇编指令栈式抽象机及其汇编指令例如,有下段程序:inta,b;a=10;b=20*a;假设记录a、b属性信息符号表为:名字类型维数地址a100b102则相对应的抽象机汇编程序如下:LOADI10STO0LOADI20LOAD0MULTSTO2这台抽象机称作TEST机。TEST机的指令仅能作为TEST语言的目标。实际上,TEST机具有精减指令集计算机的一些特性。TEST机的模拟程序直接从一个文件中读取汇编代码并执行它,因此避免了由汇编语言翻译为机器代码的过程。此外为了避免与外部的输入/输出例程连接的复杂性,TEST机有内部整型的I/O设备;在模拟时,它们都对标准设备读写。附录E列出
17、了用C语言编写的TEST机模拟程序。9.3 9.3 声明的处理声明的处理 从代码生成和语义分析的要求出发,处理声明时编译程序的主要任务有两个1)分离出每一个被声明的实体,并将它的名字填入符号表。2)尽可能多地将要保留在符号表中的有关该实体的信息填入符号表。一旦声明了一个实体,编译器就可使用符号表中的信息进行如下的分析和处理:1)检查对所声明实体的引用是否正确。2)利用已声明实体的属性信息,例如类型和已分配的目标地址,为其它执行语句生成正确的目标代码。9.3 9.3 声明的处理声明的处理不同的程序设计语言,声明语句的结构也不一样。有的语言类型说明在实体前,有的在实体后。有的语言要求每一个实体都要
18、用一个独立的声明语句进行声明(Ada语言即属于此类),有的语言在一个独立的声明语句中可声明多个类型相同的实体。C语言声明语句的类型说明是在实体前,而且,允许一条声明语句可声明多个类型相同的实体,如“Inta,b,c;”。在自左向右扫描和处理C语言声明语句时,编译器首先知道类型,在扫描到后面的实体后,就可为该实体建立符号表的记录,并可将类型及其它信息填入符号表中。而PASCAL声明语句的类型说明是在实体后且允许一次声明多个实体,如“VARage,day:integer”,那么,在自左向右扫描和处理这样的声明语句时,编译器分离出实体后,不知道该实体的类型,填符号表时,无法填写类型信息,因此,必须记
19、住这些未填类型的实体在符号表中的位置,以便在扫描到类型之后,将声明语句中有关实体的全部信息回填到符号表中。9.3.1 9.3.1 符号常量符号常量 符号常量在程序的执行期间不发生改变,其优点是:符号常量名声明一次,在程序中就可以多次使用;若要改变符号常量的值只需修改符号常量声明中符号常量的定义值,而不必去修改程序中该符号常量的每一次出现。在大多数有符号常量声明的程序设计语言中,符号常量只能在任何独立的可编译模块中声明一次。符号常量标识符被看作是全局的,因此要存放在符号表的全局部分。例如PASCAL语言的符号常量定义:constSYMBSIZE=1024下面以PASCAL语言的符号常量为示例文法
20、,讲解符号常量的语义处理:constn=c,s插入n,c,sc,sc,s|c,s|c,s常量声明的处理流程如下:1)首先识别常量的名字,将其赋给属性n;2)识别综合常量表达式,将其放在c中,并将表达式的类型赋给属性s。3)调用动作程序插入,其功能是调用符号表管理程序,将名字n、类型s及表达式的值c填入符号表中。9.3.1 9.3.1 符号常量符号常量注意,许多语言有符号常量,如PASCAL语言。我们都知道,如果一个标识符声明为常量,在程序中不能对该标识符进行赋值,只能引用。因为符号常量名虽然也保存在符号表中,但符号表中记录了符号常量的名字、类型及符号常量的值,并没有为其分配内存地址,这是符号常
21、量与变量的关键区别。C语言没有符号常量的概念,但C语言提供了宏定义,如#DEFINEPI3.14159,其功能与符号常量差不多,但概念不一样。C语言的宏定义是在预处理中完成的,在预处理中将C源程序中的所有PI替换成3.14159,因此,C编译系统实际编译的源程序并没有PI这个符号,自然PI也不会出现在符号表中。9.3.2 9.3.2 简单变量简单变量 简单变量是一种保存单个数据实体的数据区,该数据实体在程序中通常声明有指定的类型。遇到简单变量声明时,除了将其名字、类型、维数等信息填入符号表外,还要对变量分配存贮空间。对于实型、整型、逻辑型和固定长度字符串类型的变量,根据所声明的变量类型就可以确
22、定在运行时必须为变量分配的存贮空间的大小。而对于动态数据类型,如可变长度的字符串、特殊类型、类数据类型等存贮空间大小不定的数据类型,则需要作特殊的考虑。考虑下列简单变量声明的属性翻译说明:t,in svardeft,i,n,i;t,irealt,i|intt,i|chart,I动作符号svardeft,i,n,i:查询符号表,若没有,将类型及变量名存入符号表为该变量名分配存储空间,并将存储空间地址存入符号表中存入符号表;若有,报告错误:变量重复定义。符合上述文法的变量声明的例子如下:realx;intj;chars;9.3.2 9.3.2 简单变量简单变量约定约定:文法中所有规则中的符号有3个
23、继承属性vartablep,datap,labelp。但为了规则表示简洁,我们将3个继承属性省略。假设有一块大的数据空间,且该数据区的指针为datap。这个数据空间或者在编译时就分配好(静态分配),或者是在目标程序运行时动态地分配。由于TEST语言只有一种数据类型(整型),且没有数组,所以,我们设计的符号表保存两个属性,分别为名字和分配的地址,省略了类型和维数。属性vartablep指出符号表的最后一个记录的下一个位置,即第一个空白记录位置。为简化起见,我们采用无序符号表,并用一个结构数组做符号表。TEST语言简单变量声明的属性翻译文法如下:-intIDnname-defn,t;动作解释(注意
24、所有符号有继承属性vartablep,datap,labelp):vartablep指出符号表的最后一个记录的下一个位置,即第一个空白记录位置。每当有一个记录加入符号表,该值加1;datap表示已经分配的地址空间,它开始时为0,每声明一个变量,该值则根据变量类型累加,如整型加2,实型加4等等。但TEST语言只有整型,目标机又是抽象机,所以,每声明一个变量,datap加1,即增加一个存储整型的单元。9.3.2 9.3.2 简单变量简单变量name-defn,t的动作:查询符号表,从vartablep所指的前一个位置起往回查直到第一个记录,若没有,将标识符名n及类型1、datap的值填入符号表va
25、rtablep所指的位置,然后vartablep加1;若有,报告错误:变量重复定义。在具体程序实现时,可将代表vartablep,datap,lablep这3个继承属性的变量定义成同名的整型变量,并设为全局变量,初值均为0。用结构数组做符号表,名为vartablemaxvartablep,maxvartablep为符号表的最大容量,如下所示:structcharname8;intaddress;vartablemaxvartablep;intvartablep=0,datap=0,labelp=0;9.3.2 9.3.2 简单变量简单变量name-defn,t的程序如下:intname_def
26、(char*name)/查符号表inti,es=0;if(vartablep=maxvartablep)return(es=21);for(i=vartablep-1;i=0;i-)if(strcmp(vartablei.name,name)=0)es=22;/22表示变量重复定义break;if(es0)return(es);strcpy(vartablevartablep.name,name);vartablevartablep.address=datap;datap+;vartablep+;return(es);在过程name_def中,所要做的工作是将简单变量名类型等信息填入符号表。如
27、果该名字在表中已存在,则返回值22,表示变量重复定义的错误信息。返回值为21则说明符号表已满,这时编译失败,并停止编译,如进一步编译将会导致一连串的语义错误。9.3.2 9.3.2 简单变量简单变量处理声明语句的程序如下:intdeclaration_stat()intes=0;fscanf(fp,%s%sn,&token,&token1);printf(%s%sn,token,token1);if(strcmp(token,ID)return(es=3);/不是标识符eses=name_def(token1);=name_def(token1);if(es0)return(es);fscan
28、ffscanf(fpfp,%s%sn,&token,&token1);,%s%sn,&token,&token1);printfprintf(%s%sn,token,token1);(%s%sn,token,token1);if(if(strcmpstrcmp(token,;)(token,;)return(return(eses=4);=4);fscanffscanf(fpfp,%s%sn,&token,&token1);,%s%sn,&token,&token1);printfprintf(%s%sn,token,token1);(%s%sn,token,token1);return(re
29、turn(eses););9.3.3 9.3.3 数组数组 数组是一个有公共名字且类型相同的元素所组成的数据实体,在数组名字上附加一个下标就能唯一地引用一个数组元素。数组有两种类型:一种是数组的大小在编译时是已知的,即静态数组静态数组。编译程序在处理数组声明时,将建立一个模板,以便在执行期间能够间接引用该数组的元素。对于静态数组,该模板在编译期间建立。另一种数组的大小是在运行时动态地确定,即动态数组动态数组。对于动态数组,在编译时仅为模板分配一个空间,而模板本身将在运行时建立。1、数组模板内容、数组模板内容在介绍模板内容前,我们先看一下数组通常是如何存放在存贮器中的。假设有一个二维数组A(1:
30、3,-1:1),表示第一维下界为1上界为3,第二维下界为-1上界为1,那么,该数组有9个数组元素:A(1,-1)A(1,0)A(1,1)A(2,-1)A(2,0)A(2,1)A(3,-1)A(3,0)A(3,1)数组的存贮有按行方式和按列方式。按行方式是指数组元素从第一行开始一行一行地顺序存贮,见图9.1(a)。按列方式是指数组元素从第一列开始一列一列地存贮,见图9.1(b)。多数语言采用按行存贮方式,如C语言、PASCAL语言,而FORTRAN语言采用按列存贮方式。设数组维数为n,L(i)为第i维的下界,U(i)为第i维的上界,那么数组维数n及每一维的上、下界值应存放在模板中,以便用来检测引
31、用的数组元素下标是否越界以及下标数目是否与数组声明的维数相一致。9.3.3 9.3.3 数组数组2、数组元素的地址计算、数组元素的地址计算假设数组按行存贮,数组维数为n,L(i)为第i维的下界,U(i)为第i维的上界,LOC为分配给数组的数据空间的开始地址,那么可用如下公式来计算数组元素的绝对地址。假定数组元素的下标为V(1),V(2),V(n)。n绝对地址=LOC+V(i)-L(i)P(i)i=1上式中:1)当i=n时,P(i)=1n2)当1in时,P(i)=U(j)-L(j)+1j=i+1n令RC=-L(i)P(i)i=1n绝对地址=LOC+RC+V(i)P(i)i=1A(3,1)A(3,
32、0)A(3,-1)A(2,1)A(2,0)A(2,-1)A(1,1)A(1,0)A(1,-1)A(3,1)A(2,1)A(1,1)A(3,0)A(2,0)A(1,0)A(3,-1)A(2,-1)A(1,-1)(a)按行方式(b)按列方式图9-1数组的存储方式9.3.3 9.3.3 数组数组C语言规定数组下界必须为0,实际可用的上界为声明的上界减一,而且引用数组元素时如果越界,并不报错,为什么呢?观查上面的绝对地址计算公式可知,如果下界为0,则RC=0,这样绝对地址的计算公式为:n绝对地址=LOC+RC+V(i)P(i)i=1而上式中:1)当i=n时,P(i)=1n2)当1in时,P(i)=U(
33、j)+1j=i+1U(j)为第j维实际可用的上界,但如果实际可用的上界为声明的上界减一,那么P(i)的计算公式为:1)当i=n时,P(i)=1n2)当1in时,P(i)=U(j)j=i+1此时,U(j)就是声明的上界,由于它比实际可用的上界多一,所以计算时就不必再加19.3.3 9.3.3 数组数组C语言规定数组下界必须为0,实际可用的上界为声明的上界减一简化了绝对地址的计算。从上面的公式可分析出,如果是静态数组,编译时就知道维数和上下界,而RC和P的计算只和上下界有关,与引用元素的下标无关,而引用元素绝对地址的计算要使用RC和各维的P值,那么为了提高运行时绝对地址的计算速度,可在编译时先算出
34、RC及各维的P值,并保存在模板中,见图9.3(a)。如果不做越界检查,那么模板中就没有必要保存各维的上下界了,如果规定下界为0,则RC=0,也不用保存,这样模板的内容可大大简化,由此,可猜测C语言的模板只保存了各维的P值,没有保存各维的上下界,如图9.3(b)所示。U(n)L(n)P(n)U(1)L(1)P(1)RCn图9.3(a)数组模板图9.3(b)C数组模板P(n)P(2)P(1)n9.3.3 9.3.3 数组数组3、数组属性翻译文法、数组属性翻译文法数组在声明时,无论什么格式,都必须指出数组的维数及每维的上下界。下面是某语言的数组声明文法:tninitiijsymbinsertj,n,
35、tijdimentij|,ijdimentijbounds|:lowerbndupperbnd1)动作init的功能是在分配给数组的模板的数据区中保留两个存贮单元(即为n和RC),并将保存数组维数计数的属性i初始化为0。2)动作dimen简单地继承i并将其综合为i+1,以反映在说明中遇到一个多维数组。3)动作bounds生成一个存贮命令,该命令是取与有关的值,该值一般存放在操作栈的栈顶或一个专用的寄存器中,并将它赋给数组模板数据区中的U(i),同时将缺省的下界1赋给L(i),然后计算P(i)。注意可使用递归关系p(i)=U(i+1)-L(i+1)+1P(i+1)以减少与P(i)相关的计算。4)
36、动作lowerbnd生成将L(i)的存入模板中的代码。5)动作upperbnd生成计算P(i)的代码和将P(i)和U(i)的存入模板中的代码。6)动作symbinsert将数组名n、类型t和维数j填入符号表的合适位置中,并生成调用运行程序的代码,该运行程序为给定的模板计算RC并将计算结果连同数组名n一起存入模板区内。9.3.4 9.3.4 过程声明过程声明 使用过程声明的原因:1是对非嵌套过程定义的语言,如C,因为引用在定义之前,故为了正确生成调用语句的代码,需要知道参数类型,顺序和个数。2是通过使用程序库和模块的分别编译,可以隐藏过程或模块的定义。Ada是支持这一观点的最好的例子,其基本思想
37、是将模块说明的声明部分与模块体分开。声明部分的内容只需要为使用该模块的程序段可见,模块说明的实现细节则被隐藏在程序库中。程序库管理系统可利用各级权限,对模块体无访问权的模块实行限制。要实现这一目标,要求与每一个独立编译模块有关的符号表必须处于程序库管理系统的控制之下。9.4 9.4 表达式语句表达式语句 TEST语言的表达式语句文法为::=;|;从文法可看出,所谓表达式语句就是在表达式后面加上了分号。表达式在大多数程序设计语言中是用得最多的语法成分。分析表达式的主要任务是生成能正确计算表达式值的目标代码。实现这个目标的基本思路是:1)首先将表达式的操作数装载到操作数栈栈顶或某个寄存器中;2)然
38、后执行表达式所指定的操作。3)将结果保留在操作数栈或寄存器中。我们以栈式抽象机作为目标机,因此,当调用add过程时,需要生成一条无操作数的add指令,假定两个操作数均已存放在操作数栈的栈顶,执行动作后两个操作数均已出栈,结果则入栈。TEST语言的表达式与其它语言的表达式区别在于表达式中含有赋值运算符,其属性翻译文法如下::=IDnLOOKndASSIGN=STOd|:=|GT|LES|=GE|=LE|=EQ|!=NOTEQ:=(+ADD|-SUB):=(*MULT|/DIV):=()|IDnLOOKndLOADd|NUMiLOADIi9.4 9.4 表达式语句表达式语句 9.4 9.4 表达式
39、语句表达式语句 文法中的动作符号解释如下:LOOKnd:查符号表n,给出变量地址d;没有,变量没定义ASSIGN:超前读一个符号,如果是=,则表示进入赋值表达式,如果不是=,则选择,然后还要将超前读的这个符号退回。STOd:输出指令代码STOdLOADIi:输出指令代码LOADIiLOADd:输出指令代码LOADdGT、ADD等:输出后的指令代码GT、ADD等在设计程序时要注意,对于规则:=IDnLOOKnd=STOd|ID与的FIRST集合可能相交,可能都是标识符,因此添加了一个动作符号ASSIGN,超前读一个符号,如果是=,则表示进入赋值表达式,如果不是=,则选择,然后还要将超前读的这个符
40、号退回。表达式表达式的处理程序的处理程序多数程序设计语言的表达式都不含有赋值运算符,也没有表达式语句,但有赋值语句。一般赋值语句的文法为::=nLOOKnd=STOd9.5 9.5 if if 语句语句 多数语言的IF语句文法为::=ifTHENelse而TEST的IF语句文法为::=if()elseIF语句的处理思路是处理所生成的目标代码是计算该表达式的值(真或假),并将结果置于操作数栈栈顶。如果的值是假,则抽象机指令“BRF labA”将控制转到labA;否则控制传给所生成的抽象机指令序列中的下一条指令。BR指令是抽象机的无条件转移指令。TEST的IF语句属性翻译文法为::=if()BRF
41、label1BRlabel2SETlabellabel1else SETlabellabel2BRFlabel1:输出BRFlabel1BRlabel2:输出BRlabel2SETlabellabel1:设置标号label1SETlabellabel2:设置标号label2IF语句的处理程序9.5 9.5 if if 语句语句例如,有TEST程序语句:If(a5)a=1;elsea=2;按照IF语句翻译文法,设LABELP=0,则应产生下列目标代码:LOAD0/表达式a5的代码LOADI5GTBRFLABEL0/执行动作符号BRFlabel1所产生的LOADI1/a=1;的代码STO0BRLA
42、BEL1/执行动作符号BRlabel2所产生的LABEL0:/执行动作符SETlabellabel1设置标号label1LOADI2STO0LABEL1:/执行动作符SETlabellabel2设置标号label29.6 9.6 whilewhile语句语句 TEST的WHILE文法为::=while()当表达式成立时,执行语句。其属性翻译文法为::=whileSETlabellabel1()BRFlabel2BRlabel1SETlabellabel2动作解释如下:SETlabellabel1:设置标号label1BRFlabel2:输出BRFlabel2BRlabel1:输出BRlabel
43、1SETlabellabel2:设置标号label2while语句的处理程序例如,有TEST语句:While(a3)a=a+2;假设目前的标号记数的当前值为:labelp=2,则属性翻译文法应产生代码:Label2:/label1LOAD0LOADI3LEBRFlabel3/label2LOAD0LOADI2ADDSTO0BRlabel2Label3:9.7 9.7 forfor循环语句循环语句 FOR语句的属性翻译文法如下::=for(;SETlabellabel1BRFlabel2BRlabel3;SETlabellabel4BRlabel1)SETlabellabel3BRlabel4S
44、ETlabellabel2动作解释:1.SETlabellabel1:设置标号label12.BRFlabel2:输出BRFlabel23.BRlabel3:输出BRlabel34.SETlabellabel4:设置标号label45.BRlabel1:输出BRlabel16.SETlabellabel3:设置标号label37.BRlabel4:输出BRlabel48.SETlabellabel2:设置标号label2FOR语句的处理程序语句的处理程序 9.7 9.7 forfor循环语句循环语句例如,有TEST语句:For(i=1;i3;i=i+1)a=a+10;假设目前的标号记数的当前值
45、为:labelp=6则属性翻译文法应产生下列代码:LOAD2/i的地址是2LOADI1STO2Label6:/label1LOAD2LOADI3LEBRFlabel7:/label2BRlabel8/label3Label9:/label4LOAD2LOADI1ADDSTO2BRlabel6/label1Label8:/label3LOAD0/a的地址是0LOADI10ADDSTO0BRlabel9/label4Label7:9.8 9.8 write_write_语句语句 TEST语言的输出语句极为简单,其属性文法如下::=writeOUT;动作解释:OUT:输出OUT程序如下:intwri
46、te_stat()intes=0;fscanf(fp,%s%sn,&token,&token1);printf(%s%sn,token,token1);es=expression();if(es0)return(es);if(strcmp(token,;)return(es=4);/少分号fprintf(fout,OUTn);/输出指令fscanf(fp,%s%sn,&token,&token1);printf(%s%sn,token,token1);return(es);9.9 9.9 read_read_语句语句 TEST语言的输入语句与输出语句一样极为简单,其属性文法如下::=readI
47、DnLOOKndINSTId;intread_stat()intes=0,address;fscanf(fp,%s%sn,&token,&token1);printf(%s%sn,token,token1);if(strcmp(token,ID)return(es=3);/少标识符es=lookup(token1,&address);if(es0)return(es);fprintf(fout,“INn”);/输入指令fprintf(fout,STI%dn,address);fscanf(fp,%s%sn,&token,&token1);printf(%s%sn,token,token1);i
48、f(strcmp(token,;)return(es=4);/少分号fscanf(fp,%s%sn,&token,&token1);printf(%s%sn,token,token1);return(es);动作解释:LOOKnd:查符号表n,给出变量地址d;没有,变量没定义IN:输出INSTId:输出指令代码STOd程序如下:9.10 9.10 过程调用和返回过程调用和返回 处理过程调用和返回时,主要涉及下列基本问题:1)实现程序中过程调用和返回的控制逻辑。2)处理实在参数和形式参数之间的数据传递问题。在过程调用时,要将实在参数传递给形式参数。在执行过程或从过程返回时,要将过程的处理结果返回
49、给相应的主调过程。在过程调用时不同语言、不同性质的形参将采用不同的数据传递方式,而不同的数据传递方法又将对过程和过程调用的语义分析和代码生成产生影响。9.10.1 9.10.1 参数的基本传递形式参数的基本传递形式 常见的参数传递有值传递、引用传递(地址传递)、值结果传递和名字传递。1、值传递、值传递值传递又称为值调用,它是最简单的数据传递方式。在这种参数传递机制下,调用程序段要把实在参数的值计算出来并存放在操作数栈或寄存器或被调过程能够取得的数据单元中;而在被调用的子程序或函数中,首先要将实在参数的值送进相应的形式参数的数据单元中。编译程序对过程体中形式参数的处理就象处理一般实在参数标识符那
50、样,即像实在参数那样生成目标代码。这种形式参数与实在参数的结合方式,数据传递是单方向进行的,即调用段将实在参数的值传递到被调用段相应的形式参数的数据单元中,而在执行被调用段的过程中,不可能将赋值形参的数据单元中的内容再传回调用段的相应实在参数单元中去。C语言就是采用这种参数传递机制。9.10.1 9.10.1 参数的基本传递形式参数的基本传递形式2、引用传递、引用传递所谓引用传递就是传地址,又叫引用调用。在这种参数传递机制下,调用程序段要将实在参数的地址传给相应的形式参数。对于实际参数的各种情况,处理方法如下:1)若实在参数是简单变量,则编译程序要生成将它们的地址保存在操作数栈或寄存器或某个被