《SAS软件与统计应用教程 第1章SAS基础.ppt》由会员分享,可在线阅读,更多相关《SAS软件与统计应用教程 第1章SAS基础.ppt(88页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第一章 SAS基础n1.1 初识初识SASn1.2 初识初识INSIGHT模块模块n1.3 初识初识“分析家分析家”n1.4 SAS编程初步编程初步STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n1.1 1.1 初识初识SASSASn1.1.1 SAS简介n1.1.2 使用SASn1.1.3 SAS对数据文件的管理STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.1.1 SAS简介简介1.SAS1.SAS与统计分析与统计分析 在在众众多多的的统统计
2、计软软件件中中,SAS以以运运行行稳稳定定、功功能能强强大大而而著著称称。近近20年年来来,SAS一一直直占占据据着着统统计计软软件件的的高高端端市市场场,用用户户遍遍及及金金融融、医医药药卫卫生生、生生产产、运运输输、通通讯讯、政政府府和和教教育育科科研研等等领领域域。在在数数据据处处理理和和统统计计分分析析领领域域,SAS系系统被誉为国际上的标准软件,堪称统计软件界的巨无霸。统被誉为国际上的标准软件,堪称统计软件界的巨无霸。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.1.1 SAS简介简介1.SAS1.SAS与统计分析与统计分析 在在国国际际学学术术
3、界界有有条条不不成成文文的的规规定定,凡凡是是用用SAS统统计计分分析析的的结结果果,在在国国际际学学术术交交流流中中可可以以不不必必说说明明算算法法,由由此此可见其权威性和信誉度。可见其权威性和信誉度。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.SAS2.SAS的版本介绍的版本介绍 SAS是是在在1960年年代代末末期期由由两两位位北北卡卡州州立立大大学学(North Carolina State University)统统计计系系的的教教授授开开发发第第一一版版的的SAS只只含含一一般般线线性性模模型型的的分分析析法法,而而且且只只适适用用于于IBM
4、的的主主机机;1976年年成成立立SAS公公司司负负责责软软件件的的发发展展、维维护护并并提提供供相相关关服服务务PC版版本本的的SAS于于1987年年推推出出(V6.02),1989年年推推出出SAS/PC(V6.04)版版本本;1997年年下下半半年年推推出出适适用用于于多多种种操操作作系系统统的的V6.12版版本本(Windows版版);2000年年2月月又又推推出出SAS系系统统V8版版本本,2001年年推推出出SAS系系统统V8.2版本;目前版本;目前SAS最新版本为最新版本为V9.01STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.SAS3.SA
5、S的功能模块的功能模块 SAS系系统统由由三三十十几几个个模模块块组组成成,其其分分析析功功能能散散布布在在几几乎乎所所有有的的模模块块之之中中,较较为为集集中中的的具具有有统统计计分分析析功功能能的的是是SAS/BASE、SAS/STAT、SAS/QC、SAS/INSIGHT、SAS/ETS等一些模块,通过编程可以调用各种分析功能。等一些模块,通过编程可以调用各种分析功能。对对于于常常用用的的一一些些统统计计分分析析方方法法,SAS系系统统中中的的如如下下三三种方法可以达到同样的目的:种方法可以达到同样的目的:INSIGHT(“交互式数据分析交互式数据分析”)Analyst(“分析家分析家”
6、)直接编程直接编程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.1.2 使用使用SAS1.SAS1.SAS的启动的启动 在在Windows环环境境中中,用用如如下下方方法法可可以以进进入入SAS系系统统的的窗口运行环境:窗口运行环境:用用 鼠鼠 标标 选选 择择 系系 统统 菜菜 单单 项项:“开开 始始”“程程 序序”“The SAS System”“The SAS System for Windows V8”如如果果SAS安安装装系系统统在在桌桌面面上上建建立立有有快快捷捷方方式式图图标标,双击双击SAS.EXE图标启动图标启动SAS。生生成成SAS.
7、EXE的的快快捷捷方方式式(把把SAS.EXE用用鼠鼠标标右右键键拖到桌面),双击拖到桌面),双击SAS.EXE图标启动图标启动SAS。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.SAS2.SAS的操作界面的操作界面 SAS系系统统启启动动后后,进进入入SAS操操作作界界面面。SAS操操作作界界面面的的标标准准名名称称为为SAS Application WorkSpace(SAS应应用用工工作空间),简称作空间),简称SAS AWS。如如 同同 其其 它它 许许 多多Windows应应用用程程序序一一样样,SAS AWS是是一一个个多多窗窗口口界界面面:
8、在在一一个个主主窗窗口口内内包包含含若若干干个个子子窗窗口口,并并有有菜菜单单栏栏、工工具具栏栏、状状态栏等。态栏等。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(1)子窗口 SAS V8.2的的子子窗窗口口有有十十几几个个,但但初初始始状状态态下下能能见见到到的的是最常用的五个子窗口:是最常用的五个子窗口:Editor窗口:增强的程序编辑器。窗口:增强的程序编辑器。通通常常,在在Editor窗窗口口输输入入SAS程程序序,选选择择菜菜单单项项“Run”“Submit”,或或者者直直接接点点击击工工具具栏栏上上的的按按钮钮就可以运行程序。就可以运行程序。用用
9、 功功 能能 键键 F5或或 选选 择择 菜菜 单单 项项“View”“Enhanced Editor”可以打开可以打开Editor窗口。窗口。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 Log窗口:记录程序的运行情况。窗口:记录程序的运行情况。用用功功能能键键F6或或选选择择菜菜单单项项“View”“Log”可可以以打打开开Log窗口。窗口。Output窗口:显示窗口:显示SAS程序中各过程的运行结果。程序中各过程的运行结果。用用功功能能键键F7或或选选择择菜菜单单项项“View”“Output”可可以以打开打开Output窗口。窗口。Results窗口
10、:管理窗口:管理SAS程序的输出结果。程序的输出结果。选选择择菜菜单单项项“View”“Results”可可以以打打开开Results窗口。窗口。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 Explorer窗窗口口:管管理理SAS逻逻辑辑库库和和存存放放在在逻逻辑辑库库中中由由SAS系统创建的数据文件和其它类型的系统创建的数据文件和其它类型的SAS文件。文件。选选 择择 菜菜 单单 项项“View”“Explorer”可可 以以 打打 开开Explorer窗口。窗口。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2)菜单
11、栏菜单栏 SAS主主窗窗口口标标题题栏栏下下是是主主菜菜单单。SAS菜菜单单是是动动态态的的,其其内内容容随随上上下下文文而而不不同同,即即光光标标在在不不同同窗窗口口其其菜菜单单也也不不同。同。(3)工具栏工具栏 工工具具栏栏也也是是动动态态的的,当当光光标标在在编编辑辑窗窗口口时时工工具具栏栏图图标标的解释如表的解释如表1-1。其其中中提提交交程程序序按按钮钮最最为为常常用用,点点击击该该按按钮钮即即可可运运行行Editor窗口中的窗口中的SAS程序。程序。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(4)状态栏状态栏 SAS界界面面的的状状态态栏栏中中
12、显显示示当当前前工工作作目目录录,这这是是文文件件打打开、保存的缺省目录。双击此处可以更改当前工作目录。开、保存的缺省目录。双击此处可以更改当前工作目录。3.SAS3.SAS的退出的退出 在在SAS应应用用工工作作空空间间中中用用鼠鼠标标单单击击关关闭闭按按钮钮,或或者者选选择择菜菜单单“File”“Exit”,打打开开“Exit”对对话话框框,单单击击“确定确定”按钮,即可退出按钮,即可退出SAS。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.1.3 SAS对数据文件的管理对数据文件的管理 在在SAS系系统统中中建建立立的的众众多多SAS文文件件,可可按
13、按不不同同需需要要将将其其归归入入若若干干个个SAS逻逻辑辑库库,以以便便对对SAS文文件件进进行行访访问问和和管管理理。Explorer窗窗口口可可以以管管理理逻逻辑辑库库和和各各种种SAS文文件件,一般的,对于一般的,对于SAS文件的复制、查看和删除等操作。文件的复制、查看和删除等操作。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.1.逻辑库和逻辑库和SASSAS文件文件 一个逻辑库就是存放在同一文件夹中的一组一个逻辑库就是存放在同一文件夹中的一组SAS文件。文件。在在SAS系系统统的的信信息息组组织织中中,总总共共只只有有两两个个层层次次:SAS逻逻
14、辑辑库库是是高高一一级级的的层层次次,低低一一级级的的层层次次就就是是SAS文文件件本本身。身。SAS的逻辑库分为临时库和永久库两种。的逻辑库分为临时库和永久库两种。临临时时库库只只有有一一个个,名名为为Work,存存放放在在Work中中的的SAS文文件件叫叫临临时时文文件件,这这些些临临时时文文件件当当退退出出SAS系系统统时时会会被被自动删除。自动删除。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 SAS每每次次启启动动时时会会自自动动指指定定4个个库库标标记记:Work,Sasuser,Sashelp,Sasmap。Sasuser库库保保存存与与用用户
15、户个个人人设设置置有有关关的的文文件件,Sashelp库库保保存存与与SAS帮帮助助系系统统、例例子子有关的文件。有关的文件。永永久久文文件件保保存存在在永永久久库库中中,在在退退出出SAS系系统统时时不不会会自自动被删除。动被删除。在在Explorer窗窗口口中中,单单击击工工具具按按钮钮,或或是是在在右右键键菜菜单单中中选选择择“New”,打打开开“New Library”对对话话框框,可可以以建建立立新新库库,见见图图1-3。如如果果选选中中“Enable at startup”复复选选框框,则每次打开则每次打开SAS时所建逻辑库都有效。时所建逻辑库都有效。STATSTATSTATSTA
16、TSASSAS软件与统计应用教程软件与统计应用教程 SAS文文件件是是指指储储存存在在SAS逻逻辑辑库库中中的的成成员员,SAS的的用用户文件的主要类型有:户文件的主要类型有:SAS数据集数据集 SAS程序程序 访访问问一一个个SAS文文件件,一一定定要要指指明明它它所所在在的的逻逻辑辑库库,格格式式为为:逻逻辑辑库库名名.文文件件名名。如如在在Sasuser库库下下建建立立一一个个名名为为Mydata的数据集,访问的时候,要用的数据集,访问的时候,要用Sasuser.mydata。如如果果不不指指明明逻逻辑辑库库名名,则则表表示示存存储储在在临临时时逻逻辑辑库库WORK中的中的SAS文件。文
17、件。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.SAS2.SAS的名字的名字 SAS的的名名字字(数数据据集集名名、变变量量名名、逻逻辑辑库库名名等等等等)有有以下命名规则:以下命名规则:1)由英文字母、数字、下划线组成;由英文字母、数字、下划线组成;2)第一个字符必须是字母或下划线;第一个字符必须是字母或下划线;3)不区分大、小写字母。不区分大、小写字母。另另外外,SAS逻逻辑辑库库名名最最多多用用8个个字字符符;数数据据集集和和变变量量的名字最多用的名字最多用32个字符。个字符。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计
18、应用教程3.SAS3.SAS数据集数据集 SAS的的核核心心是是SAS数数据据集集。SAS数数据据集集是是SAS文文件件的的一种,一般由以下两部分组成:一种,一般由以下两部分组成:(1)描述部分描述部分 包包含含该该数数据据集集的的一一般般信信息息,包包括括:数数据据集集的的名名字字及及其其成成员员类类型型、数数据据集集建建立立的的日日期期和和时时间间、观观测测的的数数目目、变变量量的的数数目目以以及及数数据据集集中中每每一一个个变变量量的的特特征征信信息息,包包括括:Name(变变量量名名)、Type(类类型型)、Length(长长度度)、Format(输出格式输出格式)、Informat(
19、输入格式输入格式)、Label(标签标签)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2)数据部分数据部分 包包含含该该数数据据集集中中收收集集的的数数据据的的值值,可可以以看看作作是是一一个个矩矩形形的的表表格格。下下图图所所示示的的数数据据表表就就是是SAS V8自自带带的的数数据据集集Sasuser.Class,其中包含了,其中包含了19个学生的有关信息。个学生的有关信息。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.数据集的导入数据集的导入 导入导入Excel数据表的步骤如下:数据表的步骤如下:1)在在
20、SAS应应 用用 工工 作作 空空 间间 中中,选选 择择 菜菜 单单“File”“Import Data”,打打开开导导入入向向导导“Import Wizard”第一步:选择导入类型(第一步:选择导入类型(Select import type)。)。2)在在 第第 二二 步步 的的“Select file”对对 话话 框框 中中,单单 击击“Browse”按按钮钮,在在“打打开开”对对话话框框中中选选择择所所需需要要的的Excel文文件件,返返回回。然然后后,单单击击“Option”按按钮钮,选选择择所需的工作表。所需的工作表。STATSTATSTATSTATSASSAS软件与统计应用教程软
21、件与统计应用教程4.4.数据集的导入数据集的导入 导入导入Excel数据表的步骤如下:数据表的步骤如下:3)在在第第三三步步的的“Select library and member”对对话话框框中,选择导入数据集所存放的逻辑库以及数据集的名称。中,选择导入数据集所存放的逻辑库以及数据集的名称。4)在在第第四四步步的的“Create SAS Statements”对对话话框框中中,可可以以选选择择将将系系统统生生成成的的程程序序代代码码存存放放的的位位置置,完完成成导导入入过程。过程。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n1.2 1.2 初识初识INS
22、IGHTINSIGHT模块模块n1.2.1 调用INSIGHT模块n1.2.2 INSIGHT的功能概述n1.2.3 数据的预处理操作STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.2.1 调用调用INSIGHT模块模块 有如下两种方法可以调用有如下两种方法可以调用INSIGHT模块:模块:方法一:在命令行键入方法一:在命令行键入“Insight”方方法法二二:在在菜菜单单中中选选择择“Solution(解解决决方方案案)”“Analysis(分分 析析)”“Interactive Data Analysis(交互式数据分析)(交互式数据分析)”。STATS
23、TATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 INSIGHT提提供供了了一一个个类类似似于于电电子子表表格格的的数数据据窗窗口口来来管管理理数数据据集集。图图1-10为为显显示示了了数数据据集集SASUSER.CLASS的的数据窗口。数据窗口。变量个数数据窗菜单观测个数绘点符号观测序号变量作用 变量名称STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 在在SAS数数据据集集中中,变变量量分分为为两两种种类类型型:字字符符型型变变量量和和数数值值型型变变量量。在在INSIGHT中中,为为了了区区分分变变量量在在分分析析中中的的不同作用,又
24、按变量的测量水平分为两类:不同作用,又按变量的测量水平分为两类:区区间间型型变变量量(interval variable):区区间间型型变变量量必必须须是是数数值值型型变变量量,可可以以对对其其观观测测值值进进行行四四则则运运算算,计计算算各各种统计量;种统计量;列列名名型型变变量量(nominal variable):列列名名型型变变量量可可以以是是数数值值型型的的,也也可可以以是是字字符符型型的的,在在INSIGHT中中常常起起分分类类作用。作用。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.2.2 INSIGHT的功能概述的功能概述 INSIGHT是
25、是一一个个交交互互式式的的数数据据探探索索和和分分析析的的工工具具,用用这一模块可以:这一模块可以:通通过过多多窗窗口口连连动动的的图图像像和和分分析析结结果果,对对数数据据进进行行探探索;索;分析单变量分布;分析单变量分布;用相关和主成分研究多变量间的关系;用相关和主成分研究多变量间的关系;用方差分析和回归分析拟合变量间关系的模型;用方差分析和回归分析拟合变量间关系的模型;INSIGHT的各项功能可以在菜单中找到。的各项功能可以在菜单中找到。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 INSIGHT的一般操作步骤为:的一般操作步骤为:1)打打开开数数据据
26、窗窗口口,在在数数据据窗窗口口对对数数据据表表进进行行各各种种预预处处理;理;2)在在“Analyze(分分析析)”菜菜单单中中选选择择相相应应的的菜菜单单项项,进行分析;进行分析;3)查看各种分析结果。查看各种分析结果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.2.3 数据的预处理操作数据的预处理操作1.1.在数据窗中移动列在数据窗中移动列 1)单单击击数数据据窗窗口口左左上上角角处处的的三三角角按按钮钮,打打开开数数据据窗窗菜菜单单,选选择择“Move to First(移移到到最最先先)”,在在弹弹出出的的“Move to First”对对话话框
27、框中中,选选择择欲欲移移动动到到首首列列的的变变量量,单击单击“OK”按钮,即可将该变量移到第一列。按钮,即可将该变量移到第一列。将将某某个个变变量量移移到到最最后后一一列列(Move to Last)的的操操作作,可类似进行。可类似进行。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.2.3 数据的预处理操作数据的预处理操作1.1.在数据窗中移动列在数据窗中移动列 2)移移 到到 某某 两两 列列 中中 间间:选选 择择 主主 菜菜 单单“Edit”“Windows”“Tools”,打打 开开“Tools”对话框。对话框。单单击击手手形形按按钮钮,光光标标
28、变变为为手手形形,鼠鼠标标指指向向移移动动变变量量的的顶部,按住鼠标左键拖动到适当的地方即可顶部,按住鼠标左键拖动到适当的地方即可STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.对数据集排序对数据集排序 单单击击数数据据窗窗口口左左上上角角处处的的三三角角按按钮钮,打打开开数数据据窗窗菜菜单单,选选择择“Sort”,在在打打开开的的“Sort”对对话话框框中中,选选择择排排序序的的变变量量,单单击击“Y”按按钮钮,将将变变量量选选定定,然然后后按按“OK”按按钮钮即即可可。可可同同时时根根据据多多个个变变量量进进行行排排序序,默默认认是是升升序序排序,可
29、单击排序,可单击Asc/Des切换到降序。切换到降序。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.创建新的变量创建新的变量 选选择择主主菜菜单单“Edit”“Variables”“Other”,打打开开“Edit Variables”对对话话框框,可可通通过过原原变变量量的的关关系系定定义义新新的的变变量量。如如:根根据据学学生生体体重重与与身身高高之之比比建建立立新新变变量量D_weight:1)选选中中变变量量weight,单单击击“Y”,选选中中变变量量height,单单击击“X”;2)在在“Transformation”列表框中选择运算:列表
30、框中选择运算:Y/X;3)在在“Label”栏中注明:体重身高比;栏中注明:体重身高比;4)最后单击最后单击“OK”按钮,即可增加新变量列。按钮,即可增加新变量列。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.建立数据集的子集建立数据集的子集 下下述述方方法法可可以以建建立立当当前前已已打打开开数数据据集集的的子子集集。如如欲欲找找出所有男生的观测:出所有男生的观测:1)选选择择主主菜菜单单“Edit”“Observations”“Find”,打打开开“Find Observations”对对话话框框,确确定定建建立立新新数数据据表的关系式;表的关系式
31、;2)在在变变量量名名称称列列表表中中选选择择sex,在在Value(值值)列列表表中中选选择择M,单单击击“OK”按按钮钮;数数据据窗窗口口中中所所有有男男生生的的观观测测被选中;被选中;3)单单击击数数据据窗窗口口左左上上角角处处的的三三角角按按钮钮,打打开开菜菜单单,选选择择“Extract”,生成新数据集,生成新数据集;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.建立数据集的子集建立数据集的子集 4)若若要要保保存存数数据据集集,选选择择菜菜单单“File”“Save”“Data”,在在打打开开的的“Save Data”对对话话框框中中选选择
32、择保保存存的的逻逻辑库名,并输入数据集名,单击辑库名,并输入数据集名,单击“OK”按钮即可。按钮即可。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5.5.直接输入数据建立新数据表直接输入数据建立新数据表 在在INSIGHT中创建新数据表的步骤如下:中创建新数据表的步骤如下:1)选选择择主主菜菜单单“File”“New”,即即可可建建立立一一个个新新数据集;数据集;2)单单击击数数据据窗窗口口左左上上角角处处的的三三角角按按钮钮,打打开开菜菜单单,选选择择“New Variables”,在在打打开开的的对对话话框框中中输输入入变变量量个个数数;再再选选Defi
33、ne Variables,在在打打开开的的对对话话框框中中输输入入变变量量名名称称(Name)及其它属性,单击)及其它属性,单击“OK”按钮即可;按钮即可;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5.5.直接输入数据建立新数据表直接输入数据建立新数据表 在在INSIGHT中创建新数据表的步骤如下:中创建新数据表的步骤如下:3)在在单单元元格格内内输输入入数数据据,每每输输入入一一个个数数据据后后按按Enter键确认;键确认;4)选选择择菜菜单单“File”“Save”“Data”,在在打打开开的的“Save Data”对对话话框框中中选选择择保保存存的的
34、逻逻辑辑库库名名,并并输输入入数据集名,单击数据集名,单击“OK”按钮即可保存新建的数据集。按钮即可保存新建的数据集。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n1.3 1.3 初识初识“分析家分析家”n1.3.1 调用“分析家”n1.3.2 功能概述n1.3.3 “分析家”的有关操作STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.3.1 调用调用“分析家分析家”可可以以用用下下面面两两种种方方法法启启动动“分分析析家家”,打打开开“分分析析家家”窗口:窗口:方法一:在命令行中输入方法一:在命令行中输入“Analyst”
35、方方法法二二:选选择择主主菜菜单单“Solutions(解解决决方方案案)”“Analysis(分析)(分析)”“Analyst(分析家)(分析家)”STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.3.2 功能概述功能概述 “分析家分析家”的菜单功能如下:的菜单功能如下:File(文文件件)菜菜单单提提供供了了有有关关数数据据文文件件的的新新建建、读读、写、文件的导入和导出、打印和传输等功能;写、文件的导入和导出、打印和传输等功能;Edit(编编辑辑)菜菜单单提提供供了了有有关关修修改改当当前前文文件件内内容容的的一些选项;一些选项;View(查查看看)和和
36、Data(数数据据)菜菜单单提提供供了了对对读读入入数数据据集集进进行行加加工工的的一一些些功功能能,例例如如,对对数数据据集集行行列列的的增增删删,行列的排序,行列的转置和对数据集的随机取样等;行列的排序,行列的转置和对数据集的随机取样等;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.3.2 功能概述功能概述 “分析家分析家”的菜单功能如下:的菜单功能如下:Graphs(图图形形)菜菜单单提提供供了了图图形形功功能能,包包括括直直方方图图、盒形图、等高线图、三维散点图和曲面图等;盒形图、等高线图、三维散点图和曲面图等;Statistics(统统计计)菜菜
37、单单提提供供了了主主要要的的统统计计分分析析功功能能,包包括括描描述述统统计计量量计计算算、列列联联表表分分析析、假假设设检检验验、方方差差分分析和回归分析等。析和回归分析等。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.3.3 “分析家分析家”的有关操作的有关操作l.l.打开数据集打开数据集 选选 择择 主主 菜菜 单单“File(文文 件件)”“Open By SAS Name”,打打开开“Select A Member”对对话话框框,选选择择一一个个数据集作为项目的成员。数据集作为项目的成员。STATSTATSTATSTATSASSAS软件与统计应用
38、教程软件与统计应用教程2.2.导入导入ExcelExcel数据表数据表 步骤如下:步骤如下:1)选选择择主主菜菜单单“File(文文件件)”“Open(打打开开)”,在在打打开开的的对对话话框框中中,选选择择文文件件类类型型为为“Microsoft Excel Spreadsheet”;2)选选定定Excel工工作作簿簿文文件件,单单击击“打打开开”按按钮钮,打打开开“SAS Import:Spreadsheet Options”对对 话话 框框,在在“Worksheet/Range”下下拉拉列列表表中中选选择择工工作作表表名名称称,单单击击“OK”按钮即可;按钮即可;STATSTATSTAT
39、STATSASSAS软件与统计应用教程软件与统计应用教程2.2.导入导入ExcelExcel数据表数据表 3)选选择择主主菜菜单单“File(文文件件)”“Save As By SAS Name”,在在打打开开的的“Save As”对对话话框框中中,选选择择所所要要保保存存的的逻逻辑辑库库名名,并并输输入入数数据据集集名名,单单击击“Save”按按钮钮即即可。可。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.浏览和编辑浏览和编辑 已已打打开开的的数数据据集集可可处处于于浏浏览览(Browse)或或编编辑辑(Edit)两两种种不不同同的的方方式式,浏浏览
40、览方方式式只只允允许许显显示示数数据据集集的内容,编辑方式允许修改数据表的内容。的内容,编辑方式允许修改数据表的内容。可可 以以 通通 过过 选选 择择 菜菜 单单“Edit”“Mode(模模 式式)”“Edit(编编辑辑)”或或“Edit”“Mode(模模式式)”“Browse(浏览)(浏览)”进行切换。进行切换。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.改变变量显示的次序改变变量显示的次序 选选择择菜菜单单“View(查查看看)”“Columns(列列)”“Move(移移动动)”,打打开开“Move Columns”对对话话框框。在在列列表表中
41、中选选择择变变量量名名后后,使使用用上上下下箭箭头头,按按“OK”按按钮钮后后,即可改变变量显示的次序。即可改变变量显示的次序。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5.5.对数据集排序对数据集排序 对数据集排序的方法如下:对数据集排序的方法如下:1)在在“Edit(编编辑辑)”方方式式下下,选选择择菜菜单单“Data(数数据据)”“Sort(排排序序)”,打打开开“Sort(排排序序)”对对话框;话框;2)选选中中欲欲排排序序的的变变量量名名,单单击击“Sort By”按按钮钮,将将排排序变量选入右框,可选多个变量;序变量选入右框,可选多个变量;3)
42、在在 右右 列列 表表 框框 中中,选选 中中 排排 序序 变变 量量,单单 击击“Ascend/Descend”按钮可以在升序或降序之间切换。按钮可以在升序或降序之间切换。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程6.6.创建新的变量创建新的变量 在数据集中有两种方式添加新的变量。在数据集中有两种方式添加新的变量。直直 接接 插插 入入 变变 量量:选选 择择 菜菜 单单“Edit(编编 辑辑)”“Insert Columns(插插入入列列)”“Character”或或“Numeric”,指指定定插插入入变变量量的的类类型型即即可可在在数据集中插入一个新
43、的变量。数据集中插入一个新的变量。根据原变量的关系得到新变量:根据原变量的关系得到新变量:选选择择菜菜单单“Data(数数据据)”“Transform(变变换换)”“Compute(计计算算)”,打打开开“Compute(计计算算)”对话框;在对话框中确定变量关系式。对话框;在对话框中确定变量关系式。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程7.7.创建数据集的子集创建数据集的子集 打打开开一一个个数数据据集集后后,选选择择菜菜单单“Data(数数据据)”“Filter(过过滤滤)”“Subset Data(子子集集数数据据)”,打打开开“Subset”对
44、对话话框框;在在列列表表中中选选择择变变量量,在在弹弹出出的的“Operators(算算子子)”列列表表中中选选择择算算子子(比比如如EQ表示表示“等于等于”););用用鼠鼠标标单单击击列列表表框框中中的的“”,再再在在弹弹出出的的“Lookup Values”对对话话框框中中选选择择该该变变量量的的可可能取值;能取值;单击单击“OK”按钮,即可生成子集。按钮,即可生成子集。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程8.8.由数据集随机抽样由数据集随机抽样 选选择择菜菜单单“Data(数数据据)”“Random Sample(随随机机抽抽样样)”,在在打打
45、开开的的“Random Sample”对对话话框框中中,可可设设定定样样本本的的容容量量或或抽抽取取的的比比例例(Ratio)。例例如如,创创建建一个容量为一个容量为10的样本时的设置。的样本时的设置。若若要要保保存存生生成成的的样样本本,可可以以选选择择菜菜单单“File(文文件件)”“Save As By SAS Name(另存为(另存为SAS)”。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程9.9.数据集的转置数据集的转置 在在SAS许许多多具具有有分分析析功功能能的的过过程程中中,有有时时需需要要将将数数据据阵转置。方法如下:阵转置。方法如下:将行列
46、进行对换(整个进行):将行列进行对换(整个进行):选选择择菜菜单单“Data(数数据据)”“Transpose(转转置置)”,打开,打开“Transpose(转置)(转置)”对话框;对话框;在在 对对 话话 框框 中中,选选 择择 列列 表表 中中 的的 变变 量量 名名,单单 击击“Transpose”按钮,将变量名一一选入右上框;按钮,将变量名一一选入右上框;按某个变量的值分组进行:按某个变量的值分组进行:在在“Transpose(转转置置)”对对话话框框中中,可可把把某某个个变变量量的值选入右下框(的值选入右下框(Group By)。)。STATSTATSTATSTATSASSAS软件与
47、统计应用教程软件与统计应用教程n1.4 SAS1.4 SAS编程初步编程初步n1.4.1 SAS程序概述n1.4.2 指定逻辑库n1.4.3 数据步简介n1.4.4 过程步简介STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.4.1 SAS程序概述程序概述1.1.数据步与过程步数据步与过程步 SAS程程序序包包括括多多个个步步骤骤和和一一些些控控制制语语句句,一一般般情情况况下下由由两两种种类类型型的的程程序序步步(steps)组组成成:数数据据步步(DATA steps)和和过过程程步步(PROC steps)。有有时时SAS程程序序还还包包括括一一些些全全
48、程程语语句句,用用以以控控制制贯贯穿穿整整个个SAS程程序序的的某某些些选选项项、变量或程序运行的环境。变量或程序运行的环境。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1.4.1 SAS程序概述程序概述1.1.数据步与过程步数据步与过程步 数数据据步步通通常常用用于于创创建建SAS数数据据集集,但但也也可可以以用用于于产产生特别设计的报表。生特别设计的报表。过过程程步步通通常常用用于于分分析析和和处处理理SAS数数据据集集中中的的数数据据,但有时候也可用于创建数据集。但有时候也可用于创建数据集。一一个个SAS程程序序就就是是由由数数据据步步、过过程程步步或
49、或两两者者的的任任意意组组合合而而成成。每每一一个个程程序序步步通通常常由由若若干干语语句句(statements)构成。构成。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.书写规则书写规则 一个一个SAS语句有两个重要特征:语句有两个重要特征:由由SAS关键词(关键词(keyword)开始;)开始;总是以分号总是以分号“;”结束。结束。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程data c200501;input name$sex$math chinese;cards;李家富 男 92 98张丽萍 女 89 10
50、6王春雷 男 86 90刘刚 男 98 109张颍 女 80 110;proc print data=c200501;proc means data=c200501 mean;var math chinese;run;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 说明:说明:1)一一个个数数据据步步由由关关键键词词DATA开开始始,而而一一个个过过程程步步由由关键词关键词PROC开始。开始。2)SAS语语句句是是自自由由格格式式的的:一一个个语语句句可可以以由由几几行行组组成成,可可以以在在任任一一列列开开始始和和结结束束,几几个个语语句句可可以以在在同同一