第2章编程入门精选文档.ppt

上传人:石*** 文档编号:47745128 上传时间:2022-10-03 格式:PPT 页数:39 大小:1.71MB
返回 下载 相关 举报
第2章编程入门精选文档.ppt_第1页
第1页 / 共39页
第2章编程入门精选文档.ppt_第2页
第2页 / 共39页
点击查看更多>>
资源描述

《第2章编程入门精选文档.ppt》由会员分享,可在线阅读,更多相关《第2章编程入门精选文档.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第2章编程入门本讲稿第一页,共三十九页学习目标v掌握SAS语言构成,学会运用SAS语言进行编程;v掌握DATA数据步以及通过DATA步建立数据集的方法;v了解各种PROC过程步的作用;v熟悉各种SAS函数并逐渐学会其在SAS程序中的作用;v掌握数据集的各种编辑操作方法(包括建立与保存、导入和导出、连接等);v掌握一些常用的SAS语句并在SAS程序中熟练运用。本讲稿第二页,共三十九页SAS语言构成 vSAS提供了一种完善的编程语言。类似于计算机的高级语言,SAS用户只需要熟悉其命令、语句及简单的语法规则就可以做数据管理和分析处理工作。因此,掌握SAS编程技术是学习SAS的关键环节。在SAS中,把

2、大部分常用的复杂数据计算的算法作为标准过程调用,用户仅需要指出过程名及其必要的参数。这一特点使得SAS编程十分简单。本讲稿第三页,共三十九页SAS语句 v一个SAS语句是由SAS关键词,SAS名字,特殊字符串,并以分号(;)结尾,它要求SAS系统执行一种操作或给SAS系统提供信息。如:vData grade;vDo i1 to n;vInput X Y$10.;本讲稿第四页,共三十九页SAS语句vSAS关键词:许多SAS语句都是以关键词开始并用它识别语句的类型,如DATA,INPUT,PROC和INFILE都被称为关键词。vSAS名字:SAS语句中出现名字地方很多,如变量名、数据集名、格式名、

3、过程名,及作为文件名和库标记的特殊名字。SAS名字最多可由8个英文字母构成,第一个字符不能是数字,空格和特殊字符$、和#也不能用于SAS的名字中。另外,保留了一些特殊的变量名并赋于特定的意义,这些变量都是以下划线开头和结尾,如表示数据步已执行过的次数。本讲稿第五页,共三十九页SAS表达式 v表达式是由一系列算符和运算对象形成的一个指令,它被执行后产生一个目标值。运算对象是变量和常数。表达式分为简单表达式(仅用一个算符)和复合表达式(使用多个算符),如:9;Age1001;LOG(X);EXP(a);a*b/100等。SAS常数用来表示固定的值,它或者是一个数字,或者是固定的值,或者是字符串,或

4、者是其它特殊记号。SAS有五种类型的常数:数值常数:就是出现在SAS语句里的数字,完全像通常的数值一样书写,可以包括小数点和负号等;字符常数:是由单引号括起来的1到200个字符组成的;日期和时间数值常数;十六进制数值常数;十六进制字符常数。本讲稿第六页,共三十九页SAS算符 v比较算符:建立两个量之间的一种关系,并要求SAS确定这种关系是成立不成立。如果它成立,输出的运算结果是1;如果不成立,运算结果为0 v算术算符:就是数学运算中常用的五种运算符号v逻辑算符:通常用来连接一系列比较式 本讲稿第七页,共三十九页SAS算符v运算次序:下面给出复杂表达式运算次序的准则。v在括号里的表达式先计算。v

5、较高优先级的运算先被执行。v对于相同优先级的算符,左边的运算先做。本讲稿第八页,共三十九页SAS程序 v由一系列SAS语句组成一个SAS程序。SAS程序中的语句可分为两类步骤:DATA步和PROC步。这两个步骤是所有SAS程序的模块。通常用DATA步产生SAS数据集,而用PROC步对SAS数据集内的数据进行分析处理并输出结果。PROC步要求SAS从过程中调出一个过程并执行这个过程,通常用SAS数据集作为输入。本讲稿第九页,共三十九页SAS程序示例vdata whb.phones;input name$phone room height;cards;rebeccah 424 112 1.5648

6、carol 450 112 5.6235louise 409 110 1.2568gina 474 110 1.3652mimi 410 106 1.6542alice 411 106 1.6985brenda 414 106 1.3698brenda 414 105 1.8975david 438 141 1.6547betty 464 141 1.5647holly 466 140 1.5624;proc print data=phones;run;本讲稿第十页,共三十九页DATA步入门 vSAS的数据步以DATA语句开始,用于创建和处理数据集。DATA语句以关键字“data”开始,格式如

7、下:vdata 数据集名;v例如:data a.case;将创建在库a中名为case的SAS数据集,语句执行后你可在与库a对应的目录下看到刚刚建立的数据集文件case。vDATA语句所指定的数据集,一般都是以“库名.数据集名”的格式出现的,也可以单独的“数据集名”出现,此时的数据集系统默认为是临时库中的数据集,退出系统后将会被删除。本讲稿第十一页,共三十九页DATA步入门v直接输入方式:就是用SAS语句输入数据来产生SAS数据集的过程,一般形式为:v DATA 语句;v Input 语句;v (用于DATA步的其它语句)v Cards;v 数据行v ;本讲稿第十二页,共三十九页DATA步入门v

8、从外部文件读入数据集。数据若已经包含在某个外部文件(文本文件或数据文件)中,可用此方法输入数据到数据集文件中。在以上介绍的data语句后,写入以下语句:vinfile 外部文件的所在位置及名称 选项;vinput 变量名1变量名2 变量名n;vinfile语句用于从外部文件读入数据,必须出现在input语句之前。它的功能是指定一个包含原始数据的外部文件。本讲稿第十三页,共三十九页DATA步入门v从已建立的SAS数据集中产生新的数据集。如果用户从已经建立的SAS数据集中抽取部份变量或数据来形成新的SAS数据子集,可在DATA步中通过SET命令来完成。本讲稿第十四页,共三十九页DATA步语句及其类

9、型 v文件操作语句v运行语句v控制语句v信息语句 本讲稿第十五页,共三十九页文件操作语句 v用于输入数据集或者从这个DATA步输出文件操作语句语句的作用及意义Data告诉SAS开始DATA步,并开始创建一个SAS数据集Input描述数据行或外部输入文件上的记录Cards标识数据行的开始Put描述用SAS输出的这些行的格式By规定数据集被分组处理,使用by变量对分组进行定义Set从一个或几个已存在的SAS数据集中读观测Merge从两个或两个以上的SAS数据集中合并观测为单个观测Inflie识别外部文件,包含DATA步将读入的原始输入数据本讲稿第十六页,共三十九页运行语句 v使得用户可以创建或修改

10、变量,或者选择一部分观测来创建数据集 文件运行语句语句的作用及意义Delete从正被创建的数据集中删除观测Stop停止产生当前的数据集Where在进入Data步之前选择观测Output产生新的观测Remove从某个SAS数据集中删除一个观测Replace在相同的位置上替代观测本讲稿第十七页,共三十九页控制语句 v对一些确定的观测跳过一些语句,或者改变被执行语句的次序,实现从程序的一部分转移控制到另一部分 文件控制语句语句的作用及意义Do建立一组语句,它能够作为一个语句去执行End标记一个DO组或Select组结束Select有条件地执行几个SAS语句中的一个Go to使得SAS跳到本程序步带有

11、标号的语句,并从这里继续执行If then/else有条件地执行一个SAS语句本讲稿第十八页,共三十九页信息语句 v给出关于数据集或正被创建的数据集的附加信息,不是执行语句,可以出现在DATA步的任何地方,并且有同样的功能 文件信息语句语句的作用及意义Array定义一组能够用相同方法处理的变量Informat对存储变量值规定输入格式Format对输出变量值规定格式Length规定用来存储SAS变量的字节数Label把描述性标签同变量联系起来Drop指出从数据集或分析中被删除的变量Keep指出在数据集或分析中被保留的变量Rename改变数据集中一些变量的名字本讲稿第十九页,共三十九页PROC过程

12、步过程步vPROC步总是由PROC语句开始,然后给出运行的SAS过程名字。例如,运行SORT过程,则使用语句“proc sort;”来开始这个PROC步。通常PROC步只需要包括一个PROC语句给出运行的过程名字和一个RUN语句。本讲稿第二十页,共三十九页SAS过程名及其功用 vMEANS 计算基本统计量 vCHART 制作次数分布表 次数分布图vUNIVARIATE PLOT 正态分布检验 vPRINT 数 据 输 出 vSORT 数 据 排 序 vTabulate 制作表格 vANOVA 方差分析 vGLM 协方差分析 vCORR 相关系数的计算 vREG 直 线 回 归 vPRINCOM

13、P 主 成 分 分 析 本讲稿第二十一页,共三十九页SAS常用函数及其应用 vSAS函数是一个子程序,它由0个或几个自变量返回一个结果值。每个SAS函数都有一个关键名字。为了引用函数,要写出它的名字,然后写出一个自变量或几个自变量,它们用括号括起来,这个函数对这些自变量执行某种运算 本讲稿第二十二页,共三十九页SAS常用函数及其应用vSAS函数分为十七种类型,它们是算术函数、数组函数、截取函数、数学函数、三角函数、双曲函数、概率函数、分位数函数、非中心函数、样本统计函数、随机数函数、财政金融函数、逐位逻辑操作函数、数字函数、字符函数、日期和时间函数、州和邮政编码换算函数和特殊函数。SAS系统提

14、供的SAS函数,对用户编写SAS程序带来极大的方面,为统计分析计算提供更大的方面。本讲稿第二十三页,共三十九页SAS数据集vSAS数据集是关系型结构,分为两个部份:描述部份和数据部份 v描述部份包含了一些关于数据属性的信息即变量名称、类型及次序等信息;数据部份的结构完全等同于我们一般所理解的数据表,SAS数据值被安排在一个矩阵式的表状结构中,由字段和记录所构成,字段就是统计学中研究的变量,而记录就是每个研究对象的观测。本讲稿第二十四页,共三十九页SAS数据集vSAS数据集又包含在SAS数据库的文件集中。SAS数据集是最常用的一种SAS文件类型,SAS数据库还可以包含其它类型的SAS文件vSAS

15、中数据库分为永久性和临时性两种。存在于永久库中的数据集是永久存在的(只要你不去删除它),临时库中的数据集则在你退出SAS后自动被删除。v在Windows操作系统,SAS数据库以路径为基础的组织方式。为了使用SAS数据库,需要为每个SAS数据库指定一个库标记来识别。这一标记又称库逻辑名,是某个文件所在路径的别名。临时数据库的库标记为WORK,在SAS启动后自动生成,结束SAS后,库中的所有文件都被删除。本讲稿第二十五页,共三十九页临时SAS数据集的建立v当启动SAS后,系统自动建立一个临时数据存储区,用来临时存储运行SAS时建立或调用的SAS数据集,临时数据库的库标记为WORK,在SAS启动后自

16、动生成,结束SAS后,库中的所有文件都被删除。临时数据库的库标记不需要标注,即SAS程序中数据集work.abc与abc的表示含义完全相同 本讲稿第二十六页,共三十九页永久型SAS数据集的建立和保存vSAS启动后自动生成临时数据库的库标记,因而不需要专门进行命名,但当退出系统后临时数据库中的数据集会被自动清除。为了能反复多次使用同一数据集,需建立永久型SAS数据集。实际上,建立永久型SAS数据集,就是将SAS数据集储存在数据库逻辑名对应的路径目录下。本讲稿第二十七页,共三十九页数据集的导入v除了通过数据步创建数据集的方法,SAS还提供了一些其他的方式可以用来读入其他格式的数据文件。SAS可以利

17、用【FILE】菜单上的【Import Data】命令将其他格式的数据文件导入SAS系统,创建SAS自己的数据集。可以导入的数据文件格式有:dBase数据库,EXCEL工作表,LOTUS的数据库,纯文本的数据文件等。v导入的操作完全是对话式的,界面友好,简便实用。以下简单叙述导入的步骤 本讲稿第二十八页,共三十九页数据集的导出v除了导入其它格式的数据文件,SAS系统也可以导出SAS数据集为其它格式的数据文件。SAS可以利用【FILE】菜单上的【Export Data】命令将SAS数据集导出SAS系统,转换为其它格式的数据文件。同样地,可以导出的数据文件格式有:dBase数据库,EXCEL工作表,

18、LOTUS的数据库,纯文本的数据文件等。v数据的导出和导入完全是相反的两个过程,同样地,导出数据的菜单操作也完全是对话式的,以下简单叙述导出的步骤 本讲稿第二十九页,共三十九页数据集的排序 v将SAS数据集中的观测(记录)按一个或多个变量的数值大小进行排序,把结果存放在新的SAS数据集里,或者代替原始数据集,以便其它SAS过程通过使用BY语句可以直接调用该数据集。在对数据集进行合并或更新之前,也必须进行排序。SORT过程能完成对数据集的排序。本讲稿第三十页,共三十九页数据集的连接 v数据集的连接就是把几个数据集纵向连接起来,生成逐个尾部追加的合并数据集,或按一个或多个变量排序的新数据集,此过程

19、在DATA步中通过SET语句来完成。vSet语句从一个或几个已存在的SAS数据集中读取观测值。每一次set语句被执行时,SAS系统读一个观测送到程序数据向量。如果没有其它规定,set语句从输入数据集中读所有变量和所有观测。本讲稿第三十一页,共三十九页数据集的合并 v数据的合并是将两个或多个SAS数据集中的观测横向合并成一个新数据集的一个观测。请注意数据集连接和合并的差别 vSAS系统合并观测的方式依赖于是否有BY语句伴随着MERGE语句 本讲稿第三十二页,共三十九页SAS语句 v赋值语句 v输出语句 v条件语句 v循环语句 vWHERE语句 vDELETE语句 v累加语句 vBY语句 vUPD

20、ATE语句 本讲稿第三十三页,共三十九页本章小节 v掌握SAS编程技术是学习SAS的关键环节。在SAS中,把大部分常用的复杂数据计算的算法作为标准过程调用,用户仅需要指出过程名及其必要的参数。这一特点使得SAS编程十分简单。v数据步程序还可以对已建立了的数据集进行修改和产生输出。在利用SAS进行数据整理和分析之前,首先必须将数据直接输入到SAS数据集中或者把其它格式的数据文件转化为SAS数据集。本讲稿第三十四页,共三十九页本章小节v介绍了通过DATA步建立数据集的方法(直接输入方式、从外部文件读入数据集和从已建立的SAS数据集中产生新的数据集),DATA步语句及其类型(包括文件操作语句、运行语

21、句、控制语句和信息语句),DATA步是本节的重点,也是本章的重点。通过DATA步建立数据集。需要掌握不同的情况下用DATA步产生SAS数据集的不同方法,并掌握DATA步的SAS编程方法,掌握产生SAS数据集的DATA步程序。本讲稿第三十五页,共三十九页本章小节vSAS系统提供了十七种类型SAS函数,对用户编写SAS程序带来极大的方面,为统计分析计算提供更大的方面。SAS函数在许多数值计算及字符和数值数据处理方面为简化程序编写过程尤其有用。我们应了解各种函数的功用,掌握一些常见函数的应用,并在SAS程序中应用这些函数。本讲稿第三十六页,共三十九页本章小节v在Windows操作系统,SAS数据库以

22、路径为基础的组织方式。为了使用SAS数据库,需要为每个SAS数据库指定一个库标记来识别。这一标记又称库逻辑名,是某个文件所在路径的别名。SAS中数据库分为永久性和临时性两种。临时数据库的库标记为WORK,在SAS启动后自动生成,结束SAS后,库中的所有文件都被删除。本讲稿第三十七页,共三十九页本章小节v在进行数据分析前,我们可以对SAS数据集进行预处理,包括数据集的排序、连接、合并、复制、拆分和转置,在本章对这些数据集的操作方法进行了详细的讲解。需要掌握这些数据集的操作方法,并学会自己编程,灵活运送。v我们还可以在SAS数据集的整理过程中,使用各种SAS语句,以便于数据集的处理,包括赋值语句、输出语句、条件语句、循环语句、WHERE语句、DELETE语句、累加语句、BY语句和UPDATE语句等。应注意WHERE语句与IF语句的区别。应熟练掌握这些常用的SAS语句,有助于SAS数据集的操作处理。本讲稿第三十八页,共三十九页本讲稿第三十九页,共三十九页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁