SAS系统和数据分析SAS系统简介(共14页).doc

上传人:飞****2 文档编号:16813379 上传时间:2022-05-19 格式:DOC 页数:14 大小:107.50KB
返回 下载 相关 举报
SAS系统和数据分析SAS系统简介(共14页).doc_第1页
第1页 / 共14页
SAS系统和数据分析SAS系统简介(共14页).doc_第2页
第2页 / 共14页
点击查看更多>>
资源描述

《SAS系统和数据分析SAS系统简介(共14页).doc》由会员分享,可在线阅读,更多相关《SAS系统和数据分析SAS系统简介(共14页).doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精选优质文档-倾情为你奉上第一课 SAS系统简介一、 SAS系统1.SAS系统的功能SAS系统是大型集成应用软件系统,具有完备的以下四大功能:l 数据访问l 数据管理l 数据分析l 数据呈现它是美国软件研究所(SAS Institute Inc.)经多年的研制于1976年推出。目前已被许多国家和地区的机构所采用。SAS系统广泛应用于金融、医疗卫生、生产、运输、通信、政府、科研和教育等领域。它运用统计分析、时间序列分析、运筹决策等科学方法进行质量管理、财务管理、生产优化、风险管理、市场调查和预测等等业务,并可将各种数据以灵活多样的各种报表、图形和三维透视的形式直观地表现出来。在数据处理和统计分析

2、领域,SAS系统一直被誉为国际上的标准软件系统。2.SAS系统的支持技术在当今的信息时代中,如何有效地利用业务高度自动化所产生的巨量宝贵数据,挖掘出对预测和决策有用的信息,就成为掌握竞争主导权的关键因素。因此,SAS系统始终致力于应用先进的信息技术和计算机技术对业务和历史数据进行更深层次的加工。经过二十多年的发展,SAS系统现在是以下三种技术的主要提供者:l 数据仓库技术(Data Warehouse)数据仓库是用于支持管理决策过程的面向主题的、集成的、随时间而变化的、持久的(非易失的)数据集合。通俗地说,可以将数据仓库理解为“将多个生产数据源中的数据按一定规则统一集中起来,并提供灵活的观察分

3、析数据手段,从而为企业制定决策提供事实数据的支持”。 数据仓库最大的用途是能够提供给用户一种全新的方式从宏观或微观的角度来观察多年积累的数据,从而使用户可以迅速地掌握自己企业的经营运转状况、运营成本、利润分布、市场占有率、发展趋势等对企业发展和决策有重要意义的信息,使用户能制定更加准确科学的决策迅速对市场做出反应。利用数据仓库技术可以使大企业运作的像小企业一样灵活,也可以使小企业像大企业一样规范。从目前情况来看,许多企业和机构已经建立了相对完善的生产数据库系统。随着时间的推移,这些系统中积累了大量的历史数据,其中蕴含了许多重要的信息。利用数据仓库技术对这些历史数据进行分析和综合处理,可以找到那

4、些对企业发展至关重要的业务信息,从而帮助有关主管和业务部门做出更加合理的决策。 当今世界充满了剧烈竞争,正确及时的决策是企业生存和发展的最重要环节。现在,愈来愈多的企业认识到,企业要想在竞争中取胜,获得更大的收益,至关重要的是,必须利用计算机和网络技术、数据仓库技术,深层次地挖掘、分析当前和历史的生产业务数据,以及相关环境的相关数据,自动快速获取其中有用的决策信息,为企业提供快速、准确和方便的决策支持。通过对企业生产和计划的完成情况及相关环境数据进行多角度多层次的分析,以使企业的决策者及时掌握企业的运行情况和发展趋势,并对制定生产计划和长远规划提供理论指导,提高企业的管理水平和竞争优势。l 数

5、据挖掘技术(Data Mining) 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。还有很多和这一术语相近似的术语,如从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持等。 数据挖掘是一门很广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。 DMKD的研究主要有3个技术支柱,即数据库、人工智能和数理统计。 数据库最实质的应用仅仅是查询吗?理论根基最深的关系数据库最本质的技术进步点,就是数据存放和数据使用

6、之间的相互分离。查询是数据库的奴隶,发现才是数据库的主人。因此,在需求的驱动下,很多数据库学者转向对数据仓库和数据挖掘的研究,从对演绎数据库的研究转向对归纳数据库的研究。 专家系统曾经是人工智能研究工作者的骄傲。专家系统实质上是一个问题求解系统,目前的主要理论工具是基于谓词演算的机器定理证明技术。在研制一个专家系统时,知识工程师首先要从领域专家那里获取知识,这一过程实质上是归纳过程,是非常复杂的个人到个人之间的交互过程,有很强的个性和随机性。因此,知识获取成为专家系统研究中公认的瓶颈问题。用if-then等类的规则表达,约束性太大,用常规数理逻辑来表达社会现象和人的思维活动局限性太大,知识表示

7、又成为一大难题。此外,即使某个领域的知识通过一定手段获取并表达了,但这样做成的专家系统对常识和百科知识出奇地贫乏。人工智能学者开始着手基于案例的推理,尤其是从事机器学习的科学家们,不再满足自己构造的小样本学习模式的象牙塔,开始正视现实生活中大量的、不完全的、有噪声的、模糊的、随机的大数据样本,也走上了数据挖掘的道路。 数理统计是应用数学中最重要、最活跃的学科之一,如今相当强大有效的数理统计方法和工具,已成为信息咨询业的基础。信息时代,咨询业更为发达。然而,数理统计和数据库技术结合得并不算快,咨询业用数据库查询数据还远远不够。一旦人们有了从数据查询到知识发现、从数据演绎到数据归纳的要求,概率论和

8、数理统计就获得了新的生命力,所以才会立即呈现在DMKD这个结合点上。 发现工具和方法,常用的有分类、聚类、减维、模式识别、可视化、决策树、遗传算法、不确定性处理等。l 决策支持技术(Decision Support System) 决策支持系统通过结合个人的智力资源和计算机的能力来改进决策的质量。它是一个基于计算机的支持系统,服务于处理半结构化问题的管理决策制定者。 管理的核心是“决策”。全球经济一体化的进程以及信息技术的发展,消除了许多流通壁垒。企业比以往任何时候都面临着更为复杂的生存环境,更难以形成并维护其竞争壁垒。竞争的压力对企业制定决策的质量、速度都有更高要求。 决策支持系统作为一种新

9、兴的信息技术,能够为企业提供各种决策信息以及许多商业问题的解决方案,从而减轻了管理者从事低层次信息处理和分析的负担,使得他们专注于最需要决策智慧和经验的工作,因此提高了决策的质量和效率。3.SAS系统的主要模块SAS系统包含了众多的不同的模块,可完成不同的任务,主要模块有:l SAS/BASE(基础)初步的统计分析;l SAS/STAT(统计)广泛的统计分析;l SAS/QC(质量控制)质量管理方面的专门分析计算;l SAS/OR(规划)运筹决策方面的专门分析计算;l SAS/ETS(预测)计量经济的时间序列方面的专门分析计算;l SAS/IML(矩阵运算)提供了交互矩阵语言;l SAS/GR

10、APH(图形)提供了许多产生图形过程并支持众多图形设备;l SAS/ACCESS(外部数据库接口)提供了与大多数流行数据库管理系统的方便接口并自身也能进行数据管理;l SAS/ASSIST(面向任务的通用菜单驱动界面)方便用户以菜单方式进行操作;l SAS/FSP(数据处理交互式菜单系统)l SAS/AF(面向对象编程的应用开发工具)另外SAS系统还将许多常用的统计方法分别集成为两个模块LAB和INSIGHT,供用户利用图形界面和菜单直接对数据进行统计分析二、 SAS系统与统计学1. 统计分析过程统计学是运用概率论和数理统计的原理、方法研究数据资料的搜集、整理、分析和推断,从而掌握事物内在客观

11、规律。但由于受许多偶然因素的影响,同一类事物之间会存在着差异,这种差异统计上称为变异。所以必须在观测一定数量的基础上进行统计分析才有价值。变异的出现是由于许多内外因素偶然性的配合所致,因此统计研究的各种对象的表现是一种随机事件。随机事件是指一次试验结果不确定,而在一定数量重复试验的条件下呈现出统计规律性的事件。科学研究的目的就是在于阐明客观存在的规律,以便对同类事物加以估计和预测。整个统计分析过程如图1.1所示。图1.1 SAS的统计分析过程2.统计学的主要内容统计学的主要内容可概括三大块:(1) 统计研究设计l 调查设计l 试验设计(2) 统计描述l 统计表和统计图l 定量资料统计描述:(1

12、) 集中趋势的度量(算数均数、几何均数、调和均数、中位数、众数);(2) 离散趋势的度量(标准差、标准误差、变异系数、极差、四分位数间距);(3) 分布趋势的度量(分位数、偏度系数、峰度系数);(4) 随机变量及其概率分布分为:a. 离散型随机变量的概率分布(二项分布、普阿松分别、几何分布、超几何分布等);b. 连续型随机变量的概率分布(正态分布、t分布、分布、F分布、对数正态分布、指数分布、威布尔分布等)。l 定性资料的统计描述:相对指标(率和比)。(3) 统计推断l 检验:(1) 对定量资料的分布类型、方差、均数的假设检验;(2) 对定性资料分布情况或位置的假设检验;(3) 对二种属性之间

13、的独立性检验,及两种判断结果的一致性检验等。l 区间估计:(1) 对总体参数(均数、方差、率)进行区间估计;(2) 容许区间估计。l 相关分析:研究变量之间的关系,分为各指标之间无自变量与因变量和有自变量与因变量。(1) 研究变量之间的相互关系有直线相关分析、典型相关分析;(2) 研究多个变量内部的从属关系有主成分分析、因子分析、对应分析;(3) 研究多个变量内部或多个样品之间的亲疏关系有聚类分析;(4) 研究多个变量内部的各种复杂关系有线性结构方程的协方差分析;(5) 研究变量之间的依存关系有直线回归分析、曲线回归分析、多项式回归分析、多元线性回归分析、logistic概率模型回归分析、生存

14、资料的参数模型回归分析、COX模型回归分析和对数模型回归分析。l 分类的判别分析:根据一些明确分类的总体所提供的信息,对未知个体的归属进行分类的判别分析。l 时间序列分析:预测序列的未来发展情况、分析序列的基本趋势。a) WINDOWS运行环境下SAS系统的安装i. 对计算机硬软件的要求l 操作系统要求l CPU与内存要求l 硬盘存储空间要求l 系统时钟l CONFIG.SYS和AUTOEXEC.BAT因运行SAS系统时要同时打开几十个文件,因此必需增加或修改系统配置文件CONFIG.SYS中的同时打开文件个数FILES和缓冲区的大小BUFFERS参数值,它们的最小值为:FILES=50BUF

15、FERS=17为了在任意目录下运行SAS系统,请在自动引导批命令文件AUTOEXEC.BAT中加上路径搜索命令,例如:PATH D:; D:SASii. Novell局域网上共享SAS系统操作步骤:第一步,以User Windows98进入操作系统第二步,修改主网络登录为NetWare或友好登入l 双击我的电脑l 双击控制面板l 双击网络l 主网络登录:选择NetWare或友好登入系统将重新启动请特别注意:本机器是否在主网络登录中配置了NetWare或友好登入。如果否,请按步骤四操作。第三步,安装工作站的NetWare或友好登入l 选中网上邻居右键 l 单击属性l 选中网络配置,单击添加l 选

16、择要安装的网络组件为:客户,再按添加l 网络客户机选择为:厂商为Microsoft,网络客户为NetWare网络用户或Microsoft友好登录,OK第四步,登录指定的Novell网主服务器l 双击网上邻居777信息系机房:l 双击MIS_Shufe(Novell网主服务器名称,主服务器在信息系机房控制室)l 登录对话框:用户名键入Guest,口令123369计算中心机房:l 双击213(Novell网主服务器名称,主服务器在777计算中心的213房间)l 登录对话框:用户名键入Guest,口令1111(信息系机房)第五步,将服务器上的SYS目录映射到网络驱动器I: 由于服务器上的SAS软件系

17、统的config.sas文件中关于SAS系统的运行配置设定为映射的网络驱动器为I:标识,所以要:l 右键SYS出现快显菜单,选择映射到网络驱动器I:l 将登录时重新连接选项选定第六步,将SAS以快捷方式复制到桌面l 找到SAS目录下的SAS.EXE运行文件l 右键SAS.EXE出现快显菜单,选择发送到桌面快捷方式第七步,在本地工作站硬盘的D目录下建立SAS目录 由于服务器上的SAS软件系统的config.sas文件中关于SAS系统的运行配置设定为,在SAS启动时在本地工作站硬盘的D:SAS目录下存放工作库,所以要: l 打开资源管理器,单击选中D目录l 文件/新建/新文件夹/键入SAS第八步,

18、修改机器的系统日期为2002年9月l 双击我的电脑l 双击控制面板l 双击日期时间l 修改日期b) 启动SAS系统i. 交互显示管理方式l DOS状态下启动SASD:SAS - DMS - nodatel WINDOWS环境下启动SAS系统双击“The SAS System”图标ii. 交互行方式 单机方式D:SAS -NODMSiii. 非交互方式D:SAS ABC01iv. 批处理方式名为123.BAT的批处理文件:第二课 显示管理系统一、 显示管理系统窗口1 显示管理系统(Display Manager)三个主要窗口:l PROGRAM EDITOR窗口: 提供一个编写SAS程序的文本

19、编缉器l LOG窗口: 显示有关程序运行的信息l OUTPUT窗口: 显示程序运算结果的输出 2 显示管理系统的常用窗口l KEYS 查看及改变功能键的设置l LIBNAME 查看已经存在的SAS数据库l DIR 查看某个SAS数据库的内容l VAR 查看SAS数据集的有关信息l OPTIONS 查看及改变SAS的系统设置假设我们准备自定义F12功能键为OPTIONS命令,打开KEYS窗口后在F12的右边的空白区键入OPTIONS,完毕之后在命令框中键入END命令退出KEYS窗口。二、 显示管理系统命令1 显示管理系统命令的发布有四种命令的发布方式都可达到相同结果。l 在命令框中直接键入命令l

20、 按功能键l 使用下拉式菜单l 使用工具栏例如,我们要增加一个OUTPUT窗口,相应地四种操作如下:l 命令框中直接键入OUTPUT和Enterl 功能键F7l Window/Outputl Options / Edit toolsAdd按钮选择Tool,新增了一个空白按钮Command命令框中输入:OUTPUT;Help Text命令框中输入:Add new button create by DZX;Tip Text命令框中输入:Output。再单击Browse命令挑选一个合适的按钮。单击Move Dn按钮将OUTPUT按钮移动到最后Help按钮之后。单击Add按钮选择Separator,使

21、Help按钮和新增OUTPUT命令按钮之间有一个空白的分组间隙。单击Save按钮。2 文本编辑行命令文本编辑行命令的主要作用是为在PROGRAM EDITOR窗口方便和高效地输入和修改SAS程序提供一组编辑命令。文本编辑行命令可归为两个子类:l 命令行命令在命令框中输入NUMS命令l 行命令在行号上键入执行指定功能的字母来完成编辑功能例如,我们在PROGRAM EDITOR窗口中的第一行到第三行输入假设的数据和程序:“Data and program line one ”,“Data and program line two”,“Data and program line three”。若想在

22、第1行与第2行之间插入空行:l 在第1行的行号前键入 i(或I,或i1、I1)l 若想保存和调入程序:l 在命令框中键入:FILE D:SASABC02.SASl 先把光标定位到指定某行,再在命令框中键入:INCLUDE D:SASABC02.SAS三、 SAS系统的几组重要命令1 向SAS系统寻求帮助命令l F1键和F2键提供信息相当于简明的SAS使用手册2 显示管理系统命令框常用命令类 型命 令描 述显示管理命令BYE退出SASCLEAR window-name清除指定的窗口中的内容END退出当前窗口FILE filename存储到指定文件HELP帮助INCLUDE filename引入指

23、定文件KEYS进入KEYS窗口LIBNAME确认SAS数据库的内容LOG进入LOG窗口NUMS打开和关闭文本编辑器的数字区OPTIONS进入OPTIONS窗口OUTPUT进入OUTPUT窗口PROGRAM进入PROGRAM EDITOR窗口RECALL调出上次执行的程序SUBMIT提交一段程序3 文本编辑行命令本组命令很多,这里仅给出其中几个最常用的:类 型命 令描 述文本编辑行命令DN删除自当前行起的N行,D或D1都只表示删除当前行IN在当前行之后插入N个空行N使当前行内容右移N个字符N使当前行内容左移N个字符CN把自当前行起的N行内容拷贝到由A、B命令指定位置MN把自当前行起的N行内容移动

24、到由A、B命令指定位置其中一部分可单独使用,另一部分需与操作定位命令A、B(A指after,B指before)配合起来使用。例如,我们要将第一行和第二行的内容移到第三行的后面:l 第一行行号前键入M2l 第三行行号前键入A命令,然后按Enter键四、 运行SAS程序的步骤1 在PROGRAM EDITOR窗口中键入程序如图2.2所示。图2.2 一个典型的SAS程序实例2 提交这段程序有四种方法可以提交这段程序:l 在命令框中直接键入命令SUBMITl 用鼠标选择菜单命令Locals / Submitl 按功能键F3l 用鼠标点击标准工具栏的第一个按钮另外,还可以用菜单命令Locals / Su

25、bmit top line来提交PROGRAM EDITOR程序窗口中的某一条SAS语句,常用来测试这条语句的执行结果。3 查看LOG窗口的信息4 重新调出刚才提交的程序l 命令框中发布RECALL命令5 在OUTPUT窗口查看运行结果如果我们需要修改和增加运行结果报告的标题,操作如下:l 选择Globals/Options/Titles命令。l 出现TITLES窗口,删除原第一大标题的内容“The SAS system”。l 在第一行和第二行分别输入所需要的大小标题的内容。l 选择Options/Save settings now命令,保存我们刚才的修改。6 存储程序l 再发布RECALL命令重新调出刚才提交的程序。l 然后可用File / Save as 菜单命令把程序存储到外部文件中(也可发布FILE命令达到相同的目的)。l 如果今后要重新运行这个程序,用File / Open菜单命令把这个外部程序重新调入到SAS系统的PROGRAM EDITOR窗口中。l 如果今后要将这个程序插入到正在PROGRAM EDITOR窗口编辑的某程序的某处,可发布INCLUDE命令把外部这个程序导入到某程序中。SAS程序文件的后缀为 .SASD:CD SASSAS ABCTYPE ABC01.LOG | moreTYPE ABC01.LST | more专心-专注-专业

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁