统计分析系统sa(1).ppt

上传人:赵** 文档编号:68610391 上传时间:2022-12-29 格式:PPT 页数:53 大小:1.26MB
返回 下载 相关 举报
统计分析系统sa(1).ppt_第1页
第1页 / 共53页
统计分析系统sa(1).ppt_第2页
第2页 / 共53页
点击查看更多>>
资源描述

《统计分析系统sa(1).ppt》由会员分享,可在线阅读,更多相关《统计分析系统sa(1).ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第第2讲数据集的建立讲数据集的建立计算中心计算中心 计算中心计算中心SAS数据集数据集已有的已有的SAS数据集数据集数据直接输入数据直接输入其他文件格式其他文件格式SAS数据分析模块数据分析模块流行的数据库流行的数据库SAS应用程序应用程序数据集数据集计算中心计算中心逻辑库逻辑库和和SAS文件文件vSAS对数据的分析是面对对数据的分析是面对SAS数据集进行的数据集进行的;vSAS数据集是一种数据集是一种SAS文件文件vSAS文件:文件:SAS系统创建和管理的有特殊结构的系统创建和管理的有特殊结构的文件文件SAS数据集(类型为Table),SAS数据窗口(类型为View)SAS目录(类型为Cat

2、alog)等.vSAS文件存储在文件存储在SAS逻辑库中逻辑库中计算中心计算中心vSAS逻辑库的文件用两级命名方式逻辑库名逻辑库名.文件名文件名vSAS每次启动时会自动指定5个逻辑库Work,Sasuser,Sashelp,gismaps,mapsSasuser库保存与用户个人设置有关的文件库保存与用户个人设置有关的文件Sashelp库保存与库保存与SAS帮助系统、例子有关的帮助系统、例子有关的文件。文件。vSAS逻辑库临时库:名为临时库:名为WORK,系统自动指定系统自动指定永久库:可由用户定义永久库:可由用户定义逻辑库逻辑库和和SAS文件文件计算中心计算中心v用户自定义SAS逻辑库交互方式

3、交互方式命令方式命令方式Libname 逻辑库名逻辑库名 SAS文件的存储目录文件的存储目录;逻辑库逻辑库和和SAS文件文件逻辑库逻辑库和和SAS文件文件Libname aa“e:sasdata”;Data aa.class;.计算中心计算中心SAS数据集数据集SAS逻辑逻辑库库aa E:sasdata Sas中数据集中数据集aa.ClassWindows下文件下文件Class.sas7bdat定义一逻辑库定义一逻辑库aa新建一数据集新建一数据集class.计算中心计算中心逻辑库逻辑库和和SAS文件文件v用资源管理(浏览)器查看逻辑库用资源管理(浏览)器查看逻辑库进入浏览器窗口即可查看SAS文

4、件库的属性和内容库名处点鼠标右键选属性可显示该库属性计算中心计算中心vSAS的名字 SAS的名字(数据集名、变量名、逻辑库名的名字(数据集名、变量名、逻辑库名等等)有以下命名规则:等等)有以下命名规则:1)由英文字母、数字、下划线组成;由英文字母、数字、下划线组成;2)第一个字符必须是字母或下划线;第一个字符必须是字母或下划线;3)不区分大、小写字母。不区分大、小写字母。另外,另外,SAS逻辑库名最多用逻辑库名最多用8个字符;数据集和个字符;数据集和变量的名字最多用变量的名字最多用32个字符。个字符。逻辑库逻辑库和和SAS文件文件计算中心计算中心vSAS数据集(1)描述部分描述部分 包含该数据

5、集的一般信息,包括:数据集的名字包含该数据集的一般信息,包括:数据集的名字及其成员类型、数据集建立的日期和时间、观测的及其成员类型、数据集建立的日期和时间、观测的数目、变量的数目以及数据集中每一个变量的特征数目、变量的数目以及数据集中每一个变量的特征信息,包括:信息,包括:Name(变量名变量名)、Type(类型类型)、Length(长度长度)、Format(输出格式输出格式)、Informat(输入输入格式格式)、Label(标签标签)。(2)数据部分数据部分逻辑库逻辑库和和SAS文件文件计算中心计算中心 SAS数据集的建立数据集的建立数据来源及相应方法数据存于纸上数据存于纸上需直接键入需直

6、接键入数据存于文本文件数据存于文本文件数据存于流行数据存于流行数据库文件中数据库文件中用VIEWTABLE或菜单系统 编程:用数据步用SAS/ACCESS计算中心计算中心用用VIEWTABLE窗口建立数据集窗口建立数据集(1)创建数据集创建数据集单击“工具/表编辑器”单击表头顶端单元格,输入变量名在变量名下方单元格中输入数据变量类型的定义:右击变量名/column attributes计算中心计算中心用用VIEWTABLE窗口建立数据集窗口建立数据集数据集中变量的属性数据集中变量的属性变量名(Name):字母或下划线开始且不超过32个(V6为8)个字符、数字或下划线构成类型(Type):数值型

7、、字符型($)长度(Length):缺省8字节(32767)标签(Label):256字节输入格式(Informat):输入格式名w.d输出格式(Format):输出格式名w.d计算中心计算中心用用VIEWTABLE窗口建立数据集窗口建立数据集v输入输出格式输入输出格式7.2comma9.2dollar10.2输入数据输入数据输入格式输入格式实际存储实际存储 数据值数据值12234.12输出格式输出格式8.2comma9.2dollar10.2输出数据输出数据12234.1212,234.12$12,234.12122341212,234.1234$12,234.1234计算中心计算中心(2)

8、保存数据集保存数据集单击文件/保存或另存为选一个库名定义数据集名(3)打开已有数据集打开已有数据集工具/表编辑器文件/打开计算中心计算中心用用SAS INSIGHT创建数据集创建数据集vSAS/INSIGHT是一个交互式的数据探是一个交互式的数据探索和分析工具,它提供了所有的常用统计索和分析工具,它提供了所有的常用统计分析方法。用这一软件可以通过多窗口连分析方法。用这一软件可以通过多窗口连动的图象和分析结果对数据进行探索,分动的图象和分析结果对数据进行探索,分析单变量分布,用相关和主成分研究多变析单变量分布,用相关和主成分研究多变量间的关系,用方差分析和回归分析说明、量间的关系,用方差分析和回

9、归分析说明、拟合变量间关系的模型。拟合变量间关系的模型。vSAS/INSIGHT也可以创建和编辑数据也可以创建和编辑数据集集 计算中心计算中心用用SAS INSIGHT创建数据集创建数据集v单击菜单单击菜单“解答解答/分析分析/交互数据分析交互数据分析”启动启动SAS INSIGHT模块模块 v在弹出的在弹出的“SAS INSIGHT:Open”对话框的对话框的Library列表框中选定库逻辑名列表框中选定库逻辑名 v单击单击New按钮按钮 v首先在行列交汇处的数据区输入数据值首先在行列交汇处的数据区输入数据值(如下所如下所示)示)n数据的变量名在缺省情况下分别用A,B,C等命名。变量的类型(

10、数值型(Interval)和字符型(Nominal)也显示在数据表的变量上方。计算中心计算中心用用SAS INSIGHT创建数据集创建数据集v用鼠标单击在数据表左上角的三角形按钮用鼠标单击在数据表左上角的三角形按钮 系统系统弹出对数据表进行编辑弹出对数据表进行编辑 的快捷菜单的快捷菜单v Find Next:翻卷数据窗口到下一个被选择观:翻卷数据窗口到下一个被选择观测。若没有被选中的观测值,则翻卷一个观测值。测。若没有被选中的观测值,则翻卷一个观测值。vMove to First:将选中的观测或变量分别移:将选中的观测或变量分别移至数据窗口的第一行或第一列。至数据窗口的第一行或第一列。vSor

11、t:根据一个或几个变量对观测排序。:根据一个或几个变量对观测排序。vNew Observations:插入空行,以便输入:插入空行,以便输入新观测值。新观测值。vNew Variables:加入空间,以便输入新变量。:加入空间,以便输入新变量。计算中心计算中心用用SAS INSIGHT创建数据集创建数据集v Define Variable:重新定义变量:重新定义变量 vFile Values:修改该数据窗口的数据值,可:修改该数据窗口的数据值,可生成常数或以常数为增量的变量值生成常数或以常数为增量的变量值。vExtract:从已存在的数据窗口抽取数据子集来:从已存在的数据窗口抽取数据子集来生成

12、新的数据窗口。生成新的数据窗口。vData Options:设置控制数据窗口外观和操:设置控制数据窗口外观和操纵的选项。纵的选项。v单击菜单单击菜单“File/Save/Data”,在弹出的对话,在弹出的对话框中选定库名并定义数据集名框中选定库名并定义数据集名 计算中心计算中心v将文本格式的数据导入将文本格式的数据导入文件/导入数据/Select a data source from the list/Tab delimited file(数据间以制表符分隔)/nextWhere is the file/Browse/打开文本格式的文件/Options/选择数据所在的行/OK/next选择一个

13、库名定义一个数据集名用导入菜单用导入菜单计算中心计算中心v将将EXCEL格式的数据导入格式的数据导入工具/表编辑器文件/导入数据/Select a data source from the list/Microsoft Excel 2000/nextWhere is the file/Browse/打开Excel格式的文件/Options/选择数据所在的工作表/OK/next选择一个库名定义一个数据集名用用SAS/ACCESS计算中心计算中心v将将SAS格式的数据导出到格式的数据导出到Excel工具/表编辑器文件/导出数据/选择一个库名选择一个要导出的SAS数据集选择导出数据的格式Where

14、do you want to save the file/Browse/保存Excel格式的文件/Next/Finish用用SAS/ACCESS计算中心计算中心SAS语言语言数据步数据步DATA步步过程步过程步PROC步步原始原始数据数据SAS表SAS表报告报告数据步常用于创建数据集过程步常用于处理数据集(生成报表、图形和实现数据分析功能)如如proc print计算中心计算中心v数据步与过程步SAS程序包括多个步骤和一些控制语句,一程序包括多个步骤和一些控制语句,一般情况下由两种类型的程序步(般情况下由两种类型的程序步(steps)组)组成:数据步(成:数据步(DATA steps)和过程步

15、)和过程步(PROC steps)数据步通常用于创建数据步通常用于创建SAS数据集,但也可以数据集,但也可以用于产生特别设计的报表。用于产生特别设计的报表。过程步通常用于分析和处理过程步通常用于分析和处理SAS数据集中的数据集中的数据,但有时候也可用于创建数据集。数据,但有时候也可用于创建数据集。SAS程序概述计算中心计算中心用用SAS程序建立数据集程序建立数据集v程序的基本结构程序的基本结构DATA 数据集名;INPUT 变量名表;其他数据步语句;CARDS;若干数据行RUN;武汉大学计算中心武汉大学计算中心LOGO1.临时数据集的建立临时数据集的建立例例1创建一临时数据集创建一临时数据集c

16、lass1DATA CLASS1;INPUT NAME$AGE gender$H W B;CARDS;刘明刘明 3 男男 0.94 13.59 50.4 蔡行蔡行 3 男男 0.91 14.20 50.0 李敏李敏 4 女女 1.39 16.15 51.6 李涛李涛 4 男男 1.02 15.44 51.9 夏天夏天 4 男男 1.06 15.30 51.0 郭红郭红 5 女女 1.01 15.04 51.9 胡月胡月 5 女女 1.02 15.07 52.7 程彬程彬 6 女女 1.07 17.04 53.7 杨兵杨兵 6 男男 1.12 18.09 54.1 刘进刘进 6 男男 1.14

17、18.80 53.5 王苗苗王苗苗 7 女女 1.16 19.93 55.5 张思凡张思凡 7 女女 1.15 18.20 51.4RUN;PROC PRINT;RUN;武汉大学计算中心武汉大学计算中心LOGO2.永久数据集的建立永久数据集的建立例例2创建一永久数据集创建一永久数据集classbLIBNAME aa “e:sasdata;DATA aa.CLASSB;INPUT NAME$AGE gender$H W B;CARDS;刘明刘明 3 男男 0.94 13.59 50.4 蔡行蔡行 3 男男 0.91 14.20 50.0 李涛李涛 4 男男 1.02 15.44 51.9 夏天夏

18、天 4 男男 1.06 15.30 51.0 杨兵杨兵 6 男男 1.12 18.09 54.1 刘进刘进 6 男男 1.14 18.80 53.5RUN;PROC PRINT;RUN;武汉大学计算中心武汉大学计算中心LOGO2.永久数据集的建立永久数据集的建立例例3退出退出SAS后,再次进入并读取永久数据集后,再次进入并读取永久数据集classbLIBNAME BB D:aaa;PROC PRINT DATA=BB.CLASSB;RUN;计算中心计算中心数据步的工作流程数据步的工作流程数据步开始有未读入的观测值吗?用数据读入语句读入一个观测值用其它语句对观测值进行运算或处理把当前的观测值写入

19、数据集数据集建立完毕,开始下一个数据步或过程步YNLIBNAME aa e:sasdata;DATA aaCLASS1;INPUT NAME$AGE gender$H W B;CARDS;刘明刘明 3 男男 0.94 13.59 50.4 蔡行蔡行 3 男男 0.91 14.20 50.0 李敏李敏 4 女女 1.39 16.15 51.6 李涛李涛 4 男男 1.02 15.44 51.9 夏天夏天 4 男男 1.06 15.30 51.0 郭红郭红 5 女女 1.01 15.04 51.9 胡月胡月 5 女女 1.02 15.07 52.7 程彬程彬 6 女女 1.07 17.04 53.

20、7 杨兵杨兵 6 男男 1.12 18.09 54.1 刘进刘进 6 男男 1.14 18.80 53.5 王苗苗王苗苗 7 女女 1.16 19.93 55.5 张思凡张思凡 7 女女 1.15 18.20 51.4RUN;计算中心计算中心数据步语句数据步语句vSAS语言构成语言构成数据步 data 过程步 procvSAS语句语句关键字开始,分号结束vSAS表达式表达式常量数字型 12,3.14159,1.5E-8字符型“Lin ming”日期型 15jul2007d日期时间型 15JUL200714:13:20DT缺失值数字型缺失值用句点表示计算中心计算中心数据步语句数据步语句vSAS表

21、达式表达式变量数字型字符型运算符算术运算符:+,-,*,/,*比较运算符号:=,=,=,=5 and sex=“女”计算中心计算中心数据步语句数据步语句vDATA语句语句DATA 数据集名(选择项);表明数据步的开始,定义新数据集名常用选项:DROP=变量名表 KEEP=变量名表 RENAME=(老变量名=新变量名)计算中心计算中心数据步语句数据步语句vINPUT语句语句INPUT 变量$起始列-末列;INPUT 变量$SAS输入格式;读数据指针的使用行保持符或的使用计算中心计算中心数据步语句数据步语句v注释语句注释语句/*sklfjsdkfjsdk slkdjfsldk*/v赋值语句赋值语句

22、变量名=表达式;武汉大学计算中心武汉大学计算中心LOGO数据步语句数据步语句vIF语句语句IF 表达式;仅对符合条件的观测值处理或IF 表达式 THEN 语句1;ELSE 语句2;如果THEN后有多句 THEN DO;语句序列1 END;武汉大学计算中心武汉大学计算中心LOGO数据步语句数据步语句v简单简单DO语句语句DO;若干SAS语句END;武汉大学计算中心武汉大学计算中心LOGO数据步语句数据步语句v循环循环DO语句语句DO 变量=初值 TO 终值 BY 增量 while|untill(表达式);END;例DO I=1 TO 8 BY 2;DO I=2 TO 16 BY 2 UNTIL(

23、X/2)Y);DO I=1 TO 10 WHILE(XY);武汉大学计算中心武汉大学计算中心LOGO数据步语句数据步语句vDO WHILE 语句语句DO while(表达式);END;例N=0;DO WHUILE(N=5);X=N;N=N+1;END;武汉大学计算中心武汉大学计算中心LOGO数据步语句数据步语句vOUTPUT语句语句OUTPUT 数据集名;把当前的观测值写入正在建立的数据集中v例例Libname aa e:sasdata;Data aa.classb aa.classg;Set aa.class1;If gender=男 then output aa.classb;Else o

24、utput aa.classg;Run;计算中心计算中心数据步语句数据步语句vInfile语句语句指明存放数据的文本文件,Input语句将从这个文件中读数据,程序中不再出现Cards语句和原始数据。该文件中只保存一行行的原始数据(不包括Cards;语句和数据最后的分号)。v语句格式:语句格式:Infile“”;v说明:说明:Infile语句要放在Input语句前,数据文件路径要与文件实际存储路径一致。计算中心计算中心数据步语句数据步语句v例例将一外部数据文件将一外部数据文件(e:sasdatadata1.txt)转换为转换为SAS数据集数据集(数据之间空格分隔,且无变量行数据之间空格分隔,且无

25、变量行)Libname AA e:sasdata;Data aa.data2;Infile e:sasdatadata1.txt;Input name$age gender$;File print;Put name$age sex$;Run;计算中心计算中心数据步语句数据步语句vSet语句语句作用:纵向复制或连接数据集。v语句格式:语句格式:Set ;v说明说明Set语句从一个已存在的数据集中依次读取每一个观测,可进行相应处理,然后依次写入新建的数据集。计算中心计算中心数据步语句数据步语句v例:例:DATA SCORE1;INPUT NUM S1-S3;CARDS;1001 78 89 92

26、1002 87 92 97 1003 64 74 88 ;DATA TOT;SET SCORE1;TOTAL=SUM(OF S1-S3);PROC PRINT;RUN;计算中心计算中心数据步语句数据步语句vMerge语句语句作用:横向复制或连接数据集。v语句格式:语句格式:Merge;计算中心计算中心数据步语句数据步语句v删除和保留变量语句删除和保留变量语句v语句格式:语句格式:Drop ;删除变量Keep ;保留变量v说明说明虽然Drop语句指明的变量不写入建立的数据集中,但是这些变量可在该数据步的所有编程语句中使用。在 Data步中,Drop语句位于任何地方所产生的效果都相同(必须位于Da

27、ta语句之后与Cards语句之前)。Drop和Keep作用相反,不能在数据步中同时使用计算中心计算中心数据步语句数据步语句v例:例:DATA PARTS;INPUT NAME$S1 S2;TOTAL=S1+S2;DROP S1 S2;CARDS;zhanglin 78 89 wangqiang 95 87 ;Proc print;Run;计算中心计算中心数据步语句数据步语句vLength语句语句指明字符变量长度。v语句格式语句格式Length ;v例:例:DATA A;LENGTH NAME$13;INPUT NAME SEX$H W;CARDS;ZhangZhihui F 1.70 52 Z

28、haoChangtai M 1.73 55;v注意注意由于NAME变量已在LENGTH语句中定义为字符型量,故INPUT语句中可以不再用$号作定义。计算中心计算中心数据步语句数据步语句vLabel 语句语句当数据集输出(打印)时,用标号字符代替变量名,使对变量名称的描述更加详细。v语句格式语句格式Label =;v注意注意为使标号有效输出,需在Print过程语句中加Label选项。v例:例:Data a;Input num$gender$h w;Label h=身高 w=体重;Cards;101 M 1.72 61;Proc print Label;Run;计算中心计算中心数据步语句数据步语句

29、vFILE语句语句FILE 文件说明;定义一个外部文件作为当前的输出文件,以供PUT语句将数据输出到该文件中去File 全路径文件名;将PUT语句的输出写入指定文件File log;指定把put语句的输出送到日志窗口File print;把put语句的输出送到输出结果窗口计算中心计算中心数据步语句数据步语句vPUT语句语句PUT 指定列 变量$起始列-末列;将数据输出到FILE指定处或LOG窗口其中,指定列 将指针移到指定列 ;指针保持在当前行v例例读一数据集并将其转换为外部文件读一数据集并将其转换为外部文件Libname AA“e:sasdata”;Data abc;Set aa.class

30、1;File“e:sasdataclass.txt”;Put name$age gender$h w b;Run;计算中心计算中心作业作业1、下列数据为两个不同地区居民家庭收入和支出情况的抽下列数据为两个不同地区居民家庭收入和支出情况的抽样调查(单位:元),试分别统计收入和支出情况。样调查(单位:元),试分别统计收入和支出情况。将表中数据通过将表中数据通过Excel导入到导入到SAS数据集数据集MyDATA中,中,4个变量名分别为:个变量名分别为:ID、R_ID、Income和和Outgo,相,相应的标签名为家庭编号、地区编号、家庭总收入和家庭总应的标签名为家庭编号、地区编号、家庭总收入和家庭

31、总支出。上传支出。上传EXCEL格式的数据文件和数据集格式的数据文件和数据集MYDATA到到你的网络磁盘。你的网络磁盘。计算中心计算中心 家庭收支情况家庭收支情况家庭编号地区编号家庭总收入家庭总支出家庭编号地区编号家庭总收入家庭总支出121794155016222002060221716136517127302236313410273018124961455421765153019117601040522184190020128202366622050205021222501966722460218422131702400811976117023212001250912850249624217761350101427527602521980179411220101275261245525501212236181027210801380131330528202821986120014124001976291336923051522250197030215301316计算中心计算中心

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁