实验1-词法分析程序的设计与开发.doc

上传人:豆**** 文档编号:33459264 上传时间:2022-08-11 格式:DOC 页数:7 大小:226KB
返回 下载 相关 举报
实验1-词法分析程序的设计与开发.doc_第1页
第1页 / 共7页
实验1-词法分析程序的设计与开发.doc_第2页
第2页 / 共7页
点击查看更多>>
资源描述

《实验1-词法分析程序的设计与开发.doc》由会员分享,可在线阅读,更多相关《实验1-词法分析程序的设计与开发.doc(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精品文档,仅供学习与交流,如有侵权请联系网站删除编译原理实验报告课程名称: 编译原理班级: 计算1614实验成绩:指导教师: 付永钢姓名: 施心萍实验项目名称:实验一 词法分析程序设计与开发学号: 201621121097上机实践日期: 一、实验目的 深入理解有限自动机及其应用 掌握词法分析程序的开发。 掌握根据语言的词法规则构造识别其单词的有限自动机的方法 深入理解词法分析程序自动生成原理二、实验要求 掌握各类单词的形式描述用直接转向法实现有限自动机的代码编写。 独立完成PL0语言的词法分析器。 掌握词法分析程序自动生成工具LEX的使用。三、实验原理词法分析是编译过程的第一阶段。它的任务就是

2、对输入的字符串形式的源程序按顺序进行扫描,根据源程序的词法规则识别具有独立意义的单词(符号),并输出与其等价的Token序列。有限自动机是描述程序设计语言单词构成的工具,而状态转换图是有限自动机的比较直观的描述方法。我们使用确定的有限状态自动机,简记为DFA。PL/0的语言的词法分析器将要完成以下工作:(1)跳过分隔符(如空格,回车,制表符);(2)识别诸如begin,end,if,while等保留字;(3)识别非保留字的一般标识符,此标识符值(字符序列)赋给全局量id,而全局量sym赋值为SYM_IDENTIFIER。(4)识别数字序列,当前值赋给全局量NUM,sym则置为SYM_NUMBE

3、R;(5)识别:=,=之类的特殊符号,全局量sym则分别被赋值为SYM_BECOMES,SYM_LEQ,SYM_GEQ等。相关过程(函数)有getsym(),getch(),其中getch()为获取单个字符的过程,除此之外,它还完成:(1)识别且跳过行结束符;(2)将输入源文件复写到输出文件;(3)产生一份程序列表,输出相应行号或指令计数器的值。下面给出能够识别PL0语言中各类单词的DFA:根据语言的词法规则构造出识别其单词的确定有限自动机DFA, 仅仅是词法分析程序的一个形式模型,距离词法分析程序的真正实现还有一定的距离。状态转换图的程序实现通常是采用直接转向法。直接转向法又称为程序中心法,

4、是把状态转换图看成一个流程图,从状态转换图的初态开始,对它的每一个状态结点都编写一段相应的程序。四、实验步骤一、 构造识别单词的自动机1.根据给定的词法构成规则对程序语言的单词按类构造出相应的状态转换图,并根据具体需求对该状态转换图进行完善。2. 对各类单词的状态转换图合并,构成一个能识别语言所有单词的状态转换图。合并步骤为:(1) 将各类单词的状态转换图的初始状态合并为一个唯一的初态;(2) 化简调整状态冲突和对冲突状态重新编号;(3) 对上述形成的状态图进行修正,以满足识别合适单词的要求。(4) 如有必要,在合适的位置增加出错状态。二、 用直接转向法实现有限自动机的代码,生成对应的词法分析

5、程序。要严格按照给出的DFA,对每个状态编写对应的识别代码,然后对每个状态的代码用合适的分支、循环等语句进行整合,完成整个代码的合成工作,并上机进行调试。对实现的代码进行测试,给出合适的测试用例(要求至少有3个用例,二个正确识别所有的保留字、标识符、分界符、数字等;另外一个识别错误的单词。1. 样例1输入输出 生成的txt程序列表2. 样例2输入(部分)输出(部分)生成的txt程序列表(部分)3. 样例3(小数)三、 用自动生成工具LEX生成上述给定DFA所对应的PL0语言的词法分析程序。并进行调试,用上述3个测试用例进行测试,给出测试结果。编写LEX文件运用flex生成lex.yy.c文件运

6、行结果样例1样例2(部分)样例3(小数)五、实验小结FLEX通过对LEX源文件的扫描自动生成相应的语法分析函数,生成lex.yy.c程序。LEX具有“最长匹配原则”和“最先匹配原则”,能够使用简洁的正规表达式去实现语法分析程序,而且lex.yy.c中定义了很多用户可定义的全局变量以及在LEX源文件的动作中可调用的函数和宏,具有良好的可移植性。但是LEX对源文件的格式要求非常严格,而且LEX本身的查错能力很弱,所以书写时一定要特别注意。C语言提供大量的函数,其中包括系统生成的函数和用户定义的函数,语法也很容易理解,使用C语言实现语法分析程序可以较好地掌握程序的分支和流程,但是代码量很多,容易出现错误,书写的时候需要特别细心。实验的处理单词集(仅供参考)(注:单词种类统一分类如下:)单词符号 单词种类空0标识符 1整数 2+ 3- 4 * 5 /6= 7 8 9 10= 12(13) 14 15 16; 17, 18“ 19:=20var 21if 22then 23else 24while25for26begin27writeln28procedure29end30出错 100【精品文档】第 7 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁