《第8章 语义分析与中间代码生成精选PPT.ppt》由会员分享,可在线阅读,更多相关《第8章 语义分析与中间代码生成精选PPT.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第8章 语义分析与中间代码生成第1页,本讲稿共32页5.1 5.1 语义分析的任务语义分析的任务5.2 5.2 语法制导翻译语法制导翻译5.3 5.3 中间代码中间代码教学内容第2页,本讲稿共32页词法分析,语法分析:解决单词和语言成分的识别及词法和语法结构的检查。语法结构可形式化地用一组产生式来描述。给定一组产生式,我们能够很容易地将其分析器构造出来。本章要介绍的是语义分析和中间代码生成技术。程序语言中间代码目标代码翻译翻译第3页,本讲稿共32页根据语义规则对识别出的各种语法成分析其含义,进行初步翻译,生成相应的中间代码或直接生成目标代码。(1)确定数据类型)确定数据类型(2)语义检查)语义
2、检查动态语义检查:在运行时刻进行动态语义检查:在运行时刻进行 静态语义检查:在编译时完成静态语义检查:在编译时完成(3)识别含义,进行真正的翻译)识别含义,进行真正的翻译5.1语义分析的任务第4页,本讲稿共32页类型检查类型检查。控制流检查控制流检查,确保控制语句有合法的转向点。例如,确保控制语句有合法的转向点。例如,C语言中的语言中的break语句使控制跳离包括该语句的最小的语句使控制跳离包括该语句的最小的switch,while或或for语句。如果不存在包括它的这样的语语句。如果不存在包括它的这样的语句,则应报错。句,则应报错。静态语义检查第5页,本讲稿共32页静态语义检查一致性检查一致性
3、检查。很多情况下要求对象只能被定义一次。很多情况下要求对象只能被定义一次。例如,语言中规定一个标识符在同一作用域中只能被例如,语言中规定一个标识符在同一作用域中只能被说明一次,同一说明一次,同一case语句的标号不能相同,枚举类型的元语句的标号不能相同,枚举类型的元素不能重复出现等。素不能重复出现等。相关名字检查相关名字检查。有的语言中有时规定,同一名字必须。有的语言中有时规定,同一名字必须出现两次或多次。例如,出现两次或多次。例如,Ada语言中,循环或程序块可以语言中,循环或程序块可以有一个名字,它出现在这些结构的开头和结尾,如同语有一个名字,它出现在这些结构的开头和结尾,如同语句括号一般,
4、编译程序必须检查它们的配对情况。句括号一般,编译程序必须检查它们的配对情况。第6页,本讲稿共32页实际应用中比较流行的语义分析方法:实际应用中比较流行的语义分析方法:基于基于属性文法属性文法的的语法制导翻译方法语法制导翻译方法 5.2语法制导翻译第7页,本讲稿共32页附加了一组属性和运算(语义)规则的文法 5.2.1 属性文法文法符号文法符号X的属性的属性t常用常用X.t来表示来表示 语义规则是根据产生式所语义规则是根据产生式所蕴涵的语义蕴涵的语义操作建立起来的,操作建立起来的,并与并与语义分析的目标语义分析的目标有关有关不同的不同的产生式产生式对应不同的语义规则对应不同的语义规则不同的不同的
5、分析目标分析目标也对应不同的语义规则也对应不同的语义规则 1.属性的表示2.语义规则的表示语义信息语义之间的关系静态语义检查、符号表操作、代码生成及打印各种错误信息 第8页,本讲稿共32页 非终结符非终结符E E、T T及及F F都有一个综合属性都有一个综合属性val,val,符号符号i i有一个综合属性,它的值由词法分析器提供。有一个综合属性,它的值由词法分析器提供。某些非终结符加下标是为了区分一个产生式中某些非终结符加下标是为了区分一个产生式中同一非终结符多次出现同一非终结符多次出现语 义 规 则E E1+TE T T T1*FT FF (E)F i E.val=E1.val+T.valE
6、.val=T.val T.val=T1.val F.valT.val=F.valF.val=E.val F.val=i.lexval产生式例5.1第9页,本讲稿共32页5.2.2 语法制导翻译的过程语法制导翻译:语法制导翻译:将将语义规则语义规则与与语法规则语法规则相结合,在相结合,在语法分语法分析析的过程中通过执行的过程中通过执行语义动作语义动作,计算语义属性值,从而完,计算语义属性值,从而完成预定的翻译工作。成预定的翻译工作。Yacc利用的就是语法制导翻译方法,它使用符号$表示产生式左端的属性,$n表示存取产生式右端第n个文法符号相联的属性expr :expr+expr$=$1+$3;第1
7、0页,本讲稿共32页自底向上语法制导翻译自顶向下语法制导翻译语法制导翻译的实现第11页,本讲稿共32页语法制导翻译分为两种语法制导翻译分为两种处理方法处理方法:(1)语法制导定义(自底向上):)语法制导定义(自底向上):对每个产生式编制一个语义子程序,在进行语法分析的过对每个产生式编制一个语义子程序,在进行语法分析的过程中,程中,当一个产生式获得匹配时当一个产生式获得匹配时,就调用相应的语义子程,就调用相应的语义子程序实现语义检查与翻译。这种实现方案隐藏了其中语义规序实现语义检查与翻译。这种实现方案隐藏了其中语义规则的计算次序等实现细节,不必规定翻译顺序。则的计算次序等实现细节,不必规定翻译顺
8、序。(2)翻译方案(自顶向下):)翻译方案(自顶向下):在产生式右部的适当位置,插入相应的语义动作,按照分在产生式右部的适当位置,插入相应的语义动作,按照分析的进程,执行遇到的语义动作。这是一种析的进程,执行遇到的语义动作。这是一种动作与分析交动作与分析交错错的实现方案。的实现方案。第12页,本讲稿共32页输入符号串输入符号串 分析树分析树执行执行语义规则语义规则 翻译结果翻译结果翻译步骤()从分析树得到描述结点属性间依赖关系的()从分析树得到描述结点属性间依赖关系的依赖图依赖图,由,由依赖图得到语义规则的依赖图得到语义规则的计算次序计算次序(1)分析输入符号串,建立)分析输入符号串,建立分析
9、语法树分析语法树()进行语义规则的计算,得到翻译结果()进行语义规则的计算,得到翻译结果 第13页,本讲稿共32页5.2.3 语法制导定义对每个产生式编制一个对每个产生式编制一个语义子程序语义子程序在进行语法分析的过程中,在进行语法分析的过程中,当一个产生式获得匹配时当一个产生式获得匹配时,就调,就调用相应的语义子程序实现语义检查与翻译用相应的语义子程序实现语义检查与翻译综合属性继承属性自底向上自底向上传递信息传递信息自顶向下(自左自顶向下(自左向右)向右)传递信息传递信息第14页,本讲稿共32页 print(E.val)print(E.val)打印由打印由E E产生的算术表达式的值,产生的算
10、术表达式的值,可认为这条规则定义了可认为这条规则定义了L L的一个的一个虚属性虚属性。L EE E1+TE T T T1*FT FF (E)F iprint(E.val)E.val=E1.val+T.valE.val=T.val T.val=T1.val F.val T.val=F.valF.val=E.valF.val=i.lexval例5.综合属性语 义 规 则产生式第15页,本讲稿共32页一个结点的综合属性值是其子结点的某些属性来决定的+3*4的注释分析树通常使用通常使用自底向上自底向上的分析方法的分析方法在在每个结点每个结点处使用语义规则来计处使用语义规则来计算综合属性值算综合属性值当
11、一个当一个产生式获得匹配产生式获得匹配时,就调时,就调用相应的语义子程序用相应的语义子程序从从叶结点到根结点叶结点到根结点进行计算进行计算 只含有只含有综合属性综合属性的语法制的语法制导定义称为导定义称为S S属性定义属性定义第16页,本讲稿共32页5.2.5 S属性定义与自底向上翻译 LR分析器可以改造为一个翻译器,在对输入串进行语法分析的同时对属性进行计算LR分析器增加属性值(语义)栈 第17页,本讲稿共32页步 骤状 态 栈符 号 栈属 性 值 栈剩余符号串分 析 动 作10#2+3*4#移进205#2+3*4#用用Fi归约归约303#F2+3*4#用用TF归约归约402#T2+3*4#
12、用用ET归约归约501#E2+3*4#移进6016#E+23*4#移进70165#E+32*4#用用Fi归约归约80163#E+F23*4#用用TF归约归约90169#E+T23*4#移进1001697#E+T*234#移进11016975#E+T*423#用用Fi归约归约1201697 10#E+T*F234#用用TT*F归约归约130169#E+T2(12)#用用 EE+T归归约约1401#E(14)#acc第18页,本讲稿共32页产生式 enter(id.entry,L.in)语 义 规 则D TL T int T float L L1,idL idL.in=T.typeT.type=i
13、ntT.type=floatL1.in=L.in enter(id.entry,L.in)例5.3继承属性L.inint id1,id2,id3DL.in=intL.in=intL.in=intT.type=intintid2id1id3.,一个结点的继承属性值是由其父结点或兄弟结点的某些属性决定的第19页,本讲稿共32页1、文法非终结符既有综合属性,也可有继承属性;、文法非终结符既有综合属性,也可有继承属性;2、开始符号没有继承属性;、开始符号没有继承属性;3、终结符只有综合属性,由词法分析器提供。、终结符只有综合属性,由词法分析器提供。几点说明:第20页,本讲稿共32页生成中间代码的目的(
14、1)便于优化(2)便于移植常见的中间代码常见的中间代码形式形式:后缀式后缀式三地址代码三地址代码(四元式、三元式和间接三元式(四元式、三元式和间接三元式)图形图形(抽象语法树、有环无向图)(抽象语法树、有环无向图)中间代码:一种介于源语言和目标语言之间的中间语言形式5.中间代码第21页,本讲稿共32页中缀表示后缀表示a+b ab+a+b*c abc*+(a+b)*c ab+c*a:=b*c+b*d abc*bd*+:=特点特点1、运算对象出现的顺序和原有顺序(从左到右)相同、运算对象出现的顺序和原有顺序(从左到右)相同2、运算符按实际计算顺序(从左到右)出现、运算符按实际计算顺序(从左到右)出
15、现3、运算符紧跟在运算对象的后面出现,且没有括号、运算符紧跟在运算对象的后面出现,且没有括号优点:简明、便于计值优点:简明、便于计值5.3.1 后缀式第22页,本讲稿共32页5.3.1 后缀式逆波兰(后缀)表示的形成 为了说明逆波兰(后缀)表示的形成,荷兰学者W.DEJKSTRA给出下面形象的解释。波兰表示 运算对象 表达式运算符进栈运运算算符符栈栈退栈比栈顶高进栈,比栈顶低或相同的退栈比栈顶高进栈,比栈顶低或相同的退栈第23页,本讲稿共32页分别给出下列表达式的后缀表示1.-a+b*(-c+d)2.X:=-(a+b)/(c-d)-(a+b*c)3.a=c b=d4.ab+c ada+bea-
16、bc-d+*+Xab+-cd-/abc*+-:=ac=bd=abc+ad ab+e 第24页,本讲稿共32页5.3.2 三地址代码种类(1)x=y op z形式的赋值语句,其中op是二元运算符。(2)x=op y形式的赋值语句,其中op是一元运算符。(3)x=y形式的赋值语句。(4)无条件转移语句goto L,表示下一个要执行的语句是标号为L的语句。(5)条件转移语句if x rop y goto L中,rop为关系运算符,如果x和y满足关系rop,就转而执行标号为L的语句,否则顺序执行下一个语句。第25页,本讲稿共32页(6)过过程程调调用用语语句句param x 和和call p,n。源源
17、程程序序中中的的过过程程调用语句调用语句p(x1,x2,xn)可以产生如下的三地址代码:可以产生如下的三地址代码:param x1param x2 param xncall p,n其中其中n为实参个数。过程返回语句形如为实参个数。过程返回语句形如return y,其中,其中y为过为过程返回的一个值。程返回的一个值。第26页,本讲稿共32页(7)变址赋值:x=yi,把从y开始的第i个存储单元的值赋给x。xi=y,把y的值赋给x开始的第i个存储单元。其中,x,y和i都代表数据对象。(8)地址和指针赋值:x=&y,把y的地址赋给x。x=y,把y指示的地址单元中的内容赋给x。x=y,把x指向的存储单元
18、的值置为y。第27页,本讲稿共32页2具体实现四元式四元式操作符 操作数1 操作数2 结果结果:通常是由编译引进的临时变量例:X=(A+B)*(C+D)-E+,A,B,T1+,C,D,T2*,T1,T2,T3-,T3,E,T4=,T4,一,XT1,T2,T3,T4为临时变量,由四元式优化比较方便为临时变量,由四元式优化比较方便T1=A+BT2=C+DT3=T1*T2T4=T3-EX=T4第28页,本讲稿共32页操作符 左操作符数 右操作数 表达式的三元式:表达式的三元式:w*x+(y+z)(1)*,w,x(2)+,y,z(3)+,(1),(2)第三个三元第三个三元式中的操作数式中的操作数(1)
19、(2)表示第表示第(1)和第和第(2)条三元式的计条三元式的计算结果。算结果。三三元式元式第29页,本讲稿共32页例:A=B+C*D/E F=C*D三元式(1)*,C,D(2)/,(1),E(3)+,B,(2)(4)=,A,(3)(5)*,C,D(6)=,F,(5)不便于代码优化:删不便于代码优化:删除某些三元式后可能除某些三元式后可能需作一系列的修改需作一系列的修改 三元式三元式(1)*,C,D(2)/,(1),E(3)+,B,(2)(4)=,A,(3)(5)=,F,(1)间接三元式执行顺序执行顺序(1)(2)(3)(4)(1)(5)三元式的执行次序用另一张三元式的执行次序用另一张表表示表表示,优化时三元式可以优化时三元式可以不变,仅仅改变其执行顺序不变,仅仅改变其执行顺序表表第30页,本讲稿共32页例:x=y+yz+yz 抽象语法树抽象语法树5.3.3 图形表示有环无向图有环无向图第31页,本讲稿共32页重点掌握:语义分析的任务属性文法、语法制导翻译的含义自底向上和自顶向下语法制导翻译的区别和特点生成中间代码的目的,中间代码的几种形式小结小结第32页,本讲稿共32页