《SAS第讲分析家模块数据管理功能.pptx》由会员分享,可在线阅读,更多相关《SAS第讲分析家模块数据管理功能.pptx(96页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1“分析家分析家”的数据管理功能目录的数据管理功能目录 1.Analyst入门 2.数据操作 3.数据变换 4.合并数据表 5.数据的转置及堆叠和折分 6.*生成图形和统计分析功能第1页/共96页2“分析家分析家”简介简介分析家(Analyst)是为了完成基本统计分析而设计的一个菜单系统;它是用图形界面来调用SAS功能的一个模块.用户通过选择菜单系统的不同菜单项可完成数据管理,各种基本的分析功能和绘图功能.在所选择的菜单项完成每项任务后,立即显示相应的结果;因分析家是通过数据步编程和调用SAS过程联合完成的,故所用的SAS程序可以显示在一个单独窗口供我们学习使用;每项任务完成后所保留的SAS程
2、序,有关的图形和结果,在分析的过程中随时可以调出显示.第2页/共96页3“分析家分析家”简介简介分析家(ANALYST)的功能1.从菜单栏目的文件(File),编辑(Edit),查看(View)和数据(Data)下可完成数据管理功能;包括数据的筛选,数据的变换和转置等.2.图形(Graphs)栏目下是图形功能,包括直方图,盒须图,饼图,等高线图,二维或三维散点图和曲面图等.3.报表(Report)栏目支持PRINT过程的列表和TABULATE过程的汇总报表.第3页/共96页4“分析家分析家”简介简介分析家(ANALYST)的功能4.统计(Statistics)栏目下是主要的统计分析功能,包括描
3、述统计,列联表分析,假设检验,方差分析(含线性模型和混合模型等),回归分析,多变量分析(主成分和典型相关),生存分析及功效与样本量大小.5.工具(Tools)栏目可对图形查看器等的设置进行修改.6.窗口(Wondows)栏目可切换窗口,改变窗口的显示方式等.第4页/共96页5 Analyst 入门入门启动Analyst(分析家)的方法(1)键入命令ANALYST (2)用下拉菜用下拉菜单 解决方案(Solutions)分析分析(Analysis)分析家分析家(Analyst)(3)启启动SAS系系统时(从从“开始开始”“运运行行”打开打开)加上加上选项(-initcmd analyst):“d
4、:sas82sas.exe”-initcmd analyst第5页/共96页第6页/共96页第7页/共96页8 Analyst 入门入门启启动分析家分析家(Analyst)后的界面后的界面第8页/共96页9 Analyst 入门入门 进入分析家窗口后,系统自动生成一进入分析家窗口后,系统自动生成一个新的分析项目。分析家窗口分为左右个新的分析项目。分析家窗口分为左右两部分:左边为两部分:左边为项目管理项目管理,用树状目录,用树状目录显示打开的数据及其对其所进行的分析;显示打开的数据及其对其所进行的分析;右边右边显示数据显示数据。该项分析所生成的输出。该项分析所生成的输出结果的名字将列在项目管理的
5、树状目录结果的名字将列在项目管理的树状目录中,而输出的结果或图形将在单独的窗中,而输出的结果或图形将在单独的窗口里显示。口里显示。第9页/共96页10 Analyst入门入门Analyst的主菜单(Menus)文件文件(File)-新建,打开和存贮文件,项目和数 据集,及打印报表.(2)编辑编辑(Edit)-转换浏览和编辑的模式,并可 添加,拷贝和删除列和行.(3)查看查看(View)-可以移动、隐藏列,还可修改 数据表的属性.(4)工具工具(Tools)-定制输出标题,画图选项等(5)数据数据(Data)-对用户的数据筛选子集,排序,概括,串接和合并及进行计算,数据变换和转置.第10页/共9
6、6页11 Analyst入门入门Analyst的主菜单(Menus)(6)报表报表(Reports)-产生报告,列出观测等(7)图形图形(Graphs)-生成图表,图形和直方 图等.(8)统计统计(Statistics)-选择统计分析及使用 索引搜寻任务和统计量.(9)窗口窗口(Window)-切换到其他窗口.(10)帮助帮助(Help)-显示Analyst和SAS系统 的帮助信息.第11页/共96页12 Analyst 入门入门Analyst的工具条(Toolbar)Analyst的工具条包括16个图标(如产生新表,打开文件,存贮当前的表,打印数据表,预浏览,对数据表排序,取子集,计算新列,
7、生成汇总报表,生成直方图,生成二维散点图,计算汇总统计量,计算相关系数,进行单因子方差分析,进行回归分析,帮助).用户还可以定义其它工具条图标:选菜单项工具工具(Tools)从下拉菜单选定制定制(Customize)=进入进入定制工具定制工具对话窗口对话窗口=建立图标.第12页/共96页13 Analyst入门入门Analyst的工具条(Toolbar)新建一个新表 产生汇总报表 打开一个SAS文件 产生一个直方图 保存当前表格 产生一个散点图 打印数据表 计算汇总统计量 打印预览 计算相关系数 对表格进行排序 执行单向方差分析 对数据取子集 执行线性回归 由计算得到新列 分析家帮助第13页/
8、共96页14 Analyst 入门入门Analyst的索引的索引(Index)使用索引来使用索引来访问经常使用的一些常使用的一些统计任任务和和绘图任任务.例如以下任例如以下任务:Brown-Forsythe test,Bar chart horizontal,One-Way ANOVA,N-Way ANOVA,Pie chart 等等等等 从按字母从按字母顺序的任序的任务列表中列表中选择某某项任任务后后=OK,则进入完成入完成该任任务的窗口的窗口.(在你不(在你不记得在哪个菜得在哪个菜单中可以找到你想要的中可以找到你想要的过程的程的时候,可以到候,可以到Index中来中来寻找)找)第14页/共
9、96页15 Analyst 入门入门Analyst的的项项目目(Project)一个项目就是在一个或几个数据集上分析的一些结一个项目就是在一个或几个数据集上分析的一些结果果.一个项目用项目树显示一个项目用项目树显示,该树包含不同的数据表该树包含不同的数据表,报表报表,程序码程序码,以及同该项目有联系的其它结果的目录以及同该项目有联系的其它结果的目录.这些结果在项目树里呈现为一些分枝这些结果在项目树里呈现为一些分枝.通过点击加号通过点击加号(+)(+)或减号或减号(-)(-)来打开或关闭一个目来打开或关闭一个目录录.通过点击某个分枝可以浏览目录中的这个分枝通过点击某个分枝可以浏览目录中的这个分枝
10、.如如果分枝是一张数据表果分枝是一张数据表,可以浏览这张表可以浏览这张表,也可以打开这也可以打开这张表并进行分析张表并进行分析.还可以从下拉菜单选择还可以从下拉菜单选择Interactive Interactive AnalysisAnalysis来启动来启动SAS/INSIGHTSAS/INSIGHT并进行探索数据分析并进行探索数据分析.从从FileFile菜单选择菜单选择 Projects,Projects,用户可以创建用户可以创建,打开打开,存贮或删除这个分析项目存贮或删除这个分析项目(V8).(V8).第15页/共96页16 Analyst 入门入门浏览和存和存贮程序程序码功能功能 用
11、用户在在Analyst里里对数据数据进行任行任何何统计分析和分析和绘图任任务后后,都可以都可以浏览和存和存贮程序程序码.这些源程序可些源程序可以拷以拷贝到到编辑窗窗进行行编辑,然后再然后再提交系提交系统执行行.第16页/共96页17 Analyst 入门入门在多个窗口在多个窗口浏览结果果 可以可以对一个或几个数据表一个或几个数据表进行分析行分析,并在多个窗口同并在多个窗口同时浏览结果果.若双若双击在在项目目树的某的某项结果上果上,则在在单个窗口个窗口浏览这个个结果果.在相同的在相同的结果上果上还可以打开一个新的窗口来可以打开一个新的窗口来浏览这个个结果果.第17页/共96页18 Analyst
12、 入门入门存存贮任任务选项功能功能 通通过在任在任务对话窗里双窗里双击 Save Options来存来存贮贮同同这项这项任任务务有关的有关的选选项项.以后当用以后当用户户点点击击Reset纽时纽时,这这些些选项选项将用来作将用来作为为用用户户的缺省的缺省选项选项.第18页/共96页19 Analyst 入门入门存存贮文本和文本和绘图结果果 可把程序可把程序码及分析和及分析和绘图的的结果存果存为文件文件.选中中项目目树中的某个分枝中的某个分枝,并从下拉并从下拉菜菜单选择另存为另存为(Save as)来存来存贮程序程序码和和结果果.然后指定文件名并然后指定文件名并选择一种文一种文件件类型型.对于于
13、绘图结果果,可用可用GIF,JPEG等等格式来存格式来存贮.第19页/共96页20Analyst 入门入门定制用定制用户的会的会话功能功能 通通过从从工具工具(Tools)菜菜单项=选择查看查看器设置器设置(Viewer Settings),=并并设置置浏览器的特性来定制用器的特性来定制用户的分析会的分析会话.选择图形设置图形设置(Graph Settings),并并设置置绘图的特性的特性.全局全局选项,用用户在某在某项任任务中中规定的定的设置置,这时都将被覆盖都将被覆盖.第20页/共96页21 数据操作数据操作打开数据集 Analyst的数据表显示来自SAS数据集,SAS视窗和其它数据源(如
14、文本文件,Excel 电子表,SPSS文件)的数据.从文件(文件(Files)菜单可以创建新数据表,打开SAS数据集及浏览,打开非 SAS文件(V8).第21页/共96页22数据操作数据操作打开数据集打开数据集从从文件(文件(Files)打开 将进入以下窗口:用户可以选择将要打开用户可以选择将要打开的数据文件的类型的数据文件的类型第22页/共96页23数据操作数据操作打开数据集打开数据集 如果打开的数据为如果打开的数据为SAS数据集数据集,则常则常通过从通过从 文件(文件(Files)用用A A名称名称打开打开 在弹出的选择成员选择成员窗口中从某个逻辑库中选择将被打开的SAS 数据集名字(比如
15、从SASUSER库中选择数据集库中选择数据集 CLASS).第23页/共96页24数据操作数据操作数据集的浏览与编辑模式 在分析时当打开一个文件或在分析时当打开一个文件或SASSAS库的成库的成员时员时,数据被转换为数据被转换为数据表数据表.在此可浏览在此可浏览,编辑及编辑及整整理数据表的行和列理数据表的行和列.数据表被打开的模式可以是浏览数据表被打开的模式可以是浏览,编辑编辑和和共享编辑三种模式之一共享编辑三种模式之一(类似于类似于VT界面界面).由由 编辑编辑(Edit)=模式模式(Model)=可以从浏览可以从浏览,编辑和共享编辑编辑和共享编辑 三种模式中任选一种三种模式中任选一种.第2
16、4页/共96页25数据操作数据操作对列的操作 在数据表中可以对列或行进行在数据表中可以对列或行进行操作操作.如移动列如移动列,插入列插入列,拷贝列或拷贝列或删除列删除列,隐藏列隐藏列,固定列固定列;添加行或添加行或删除行删除行,按变量的值对行排序按变量的值对行排序;以以及浏览变量名或列标签及浏览变量名或列标签.第25页/共96页26数据操作数据操作对列的操作-在浏览(或编辑)模式下在浏览(或编辑)模式下 1.改变列的显示顺序 由查看查看(View)=列列(Columns)=移动移动(Move)在出现的Move Columns(移动列)对话窗口选中想移动的变量按箭头方向上下随意移动来改变列的显示
17、次序.也可以先选中某列(该列加亮),然后点鼠标右键,在弹出的菜单项中选 Move来改变列的显示顺序。以下介绍的其它列操作也可用类似的方法。第26页/共96页27数据操作数据操作对列的操作-在浏览(或编辑)模式下在浏览(或编辑)模式下 2.隐藏一些列不显示 由查看(View)=列列(Columns)=隐藏(Hide)在出现的在出现的Hide Columns(隐藏隐藏列列)对话窗口选中想对话窗口选中想隐藏起来不显示的变量放到隐藏起来不显示的变量放到Hide框里,然后按OK可以让所选中的几列不显示。可以让所选中的几列不显示。若由查看(View)=列列(Columns)=取消隐藏(Hide)又可以把已
18、被隐藏不显示的列重新显示在数据表中。又可以把已被隐藏不显示的列重新显示在数据表中。第27页/共96页28数据操作数据操作对列的操作-在浏览(或编辑)模式下在浏览(或编辑)模式下 3.固定几列在表的前面不随游标而左右移动 由查看(View)=列列(Columns)=保持(Hold)可以固定选中的几列总保持在表的左边位置显示.4.用列用列标签显示示 由查看(View)=列列(Columns)=标签(Lables)要求用要求用变量(列)的量(列)的标签显示数据表。示数据表。第28页/共96页29数据操作数据操作对列的操作-在编辑模式下在编辑模式下编辑数据编辑数据1.插入新变量(列):由 编辑编辑(E
19、dit)=插入列插入列(Insert Column)=选字符型(Character)或数值型(Numeric),即可在数据表的最右边或选中变量(列)的左边插入新变量.2.拷拷贝选中的一列或几列中的一列或几列 首先首先选中数据表中要复制的几个列,然后中数据表中要复制的几个列,然后 由 编辑(Edit)=复制(Duplicate)把它把它们复制到所复制到所选中列的面前中列的面前.第29页/共96页30数据操作数据操作对列的操作-在编辑模式下在编辑模式下编辑数据编辑数据 3.删除选中的一列或几列 首先选中数据表中要删除的某个列或几个列,然后 由编辑编辑(Edit)=删除删除(Delete)可删除选中
20、的列.第30页/共96页31数据操作数据操作对行的操作-在编辑模式下在编辑模式下编辑数据编辑数据 在分析家窗口将光标置于打开数据表的某一行序号上并点击右键,就表示选中该行,同时在弹出菜单中也显示了可对这一行进行的操作:Add在数据表的最后加入一新行在数据表的最后加入一新行;Duplicate将该行复制到数据表的最将该行复制到数据表的最后一行后一行;Delete-删除选中的行删除选中的行.第31页/共96页32数据操作数据操作对行的操作-在编辑模式下在编辑模式下编辑数据编辑数据 或者先选中某行或者先选中某行,然后然后 由编辑编辑(Edit)=删除删除(Delete)则系统在询问对话框得到肯定后立
21、即将把这一行从数据表中删除;或由编辑编辑(Edit)=复制复制(Duplicate)则将选中的行复制到数据表的最后一行将选中的行复制到数据表的最后一行.由编辑编辑(Edit)=添加行(Add row)则在数据表的最后加入一新行则在数据表的最后加入一新行.第32页/共96页33数据操作数据操作存贮数据 可以存贮数据表中的数据为可以存贮数据表中的数据为SASSAS支持的任支持的任何何格式格式,包括包括SASSAS数据集数据集,文本文件文本文件,Excel,Excel和和LotusLotus文件文件.由由 文件文件(File(File)=)=保存保存(Save(Save),),可存贮修改可存贮修改后
22、后的数据集的数据集;由由文件文件(File(File)=)=另存为另存为(Save as),(Save as),可存可存贮当贮当前数据表为非前数据表为非SASSAS格式或存为其它格式或存为其它SASSAS数据数据集集.由由文件文件(File(File)=)=用用SASSAS名称另存为名称另存为(Save(Save as as SAS nameSAS name),),可存贮当前数据表为所选择的可存贮当前数据表为所选择的SASSAS库中的库中的SASSAS数据集数据集.第33页/共96页34 数据操作数据操作筛选数据 由 数据数据(Data)=过滤过滤(Filter),然后选择取数据子集取数据子集
23、(Subset data),并对数据集应用 Where条件(如SEX=M)来浏览数据集的子集.若要保存,可若要保存,可 选选 文件文件=另存为另存为 SAS.(比如找出所有男生的观测)(比如找出所有男生的观测)第34页/共96页35 数据操作数据操作排序对话窗(编辑模式编辑模式)由 数据数据(Data)=排序排序(Sort),候选的变量列表中选择用于排序的变量;如选中的变量不只一个,对Sort by列表可用向上或向下的箭头规定排序变量的顺序;选中一变量后,还可规定按上升或下降的次序排序.第35页/共96页36数据操作数据操作产生某些分布的随机变量(编辑模式编辑模式)由 数据数据(Data)=随
24、机变量随机变量 (Random Variates),可生成基于某个分布的随机变量.分布包括正态分布,均匀分布,二项分布,泊松分布,指数分布,伽码分布,几何分布,极值分布.第36页/共96页37数据操作数据操作分组概括数据由 数数据据(Data)=按组汇总按组汇总 (Summarize by Group),可对数据表里的观测按分组变量所分成的几个组分别计算概 括统计量.第37页/共96页38数据操作数据操作产生随机样本 由数据数据(Data)=随机抽样随机抽样 (Random Sample),可由原数据表生成用户指定样本个数为n(或抽取的比例)的随机样本.第38页/共96页39数据操作数据操作生
25、成汇总报表 由 报表报表(Report)=数据列表数据列表(List Data),可用列表方式显示数据表里数据(可选择id变量,列表变量等).由报表报表(Report)=表表.(Tables),可用汇总报表的方式生成五种形式的报表.第39页/共96页40 数据操作数据操作生成汇总报表选择菜菜单项报表报表(Reports)=表表.(Tables),再再选择一一种表格形种表格形式式进行行设置置.如如选择表格表格(5)(1)(2)(3)(4)(5)第40页/共96页41 数据操作数据操作生成汇总报表Summary标签下汇总了变量的选择第41页/共96页42 数据操作数据操作生成汇总报表Options
26、按键可打开设置附加选项的窗口TotalTotal第42页/共96页43数据变换数据变换在编辑模式下在编辑模式下1.计算新变量 由 数据数据(Data)=变换变换(Transform)=计算计算(Compute),将显示计算对话窗,利用这个窗口来规定关系式,公式或表达式,以便在数据表中生成新的变量(列).第43页/共96页44数据变换数据变换在编辑模式下在编辑模式下2.求秩(Rank)由数据(Data)=变换(Transform)=求秩(Rank),将显示求秩对话框,利用这个窗口来变量(列)的秩(包括简单秩等).3.对变量量标准化准化(Standardize)由数据(Data)=变换变换(Tra
27、nsform)=标准化标准化(Standardize),将显示变量标准化对话窗,利用这个窗口可以将变量(列)标准化.第44页/共96页45数据变换数据变换在编辑模式下在编辑模式下 4.重新定义记录的值(Recode Values)由 数据(Data)=变换(Transform)=记录值(Recode Values),将显示重新定义记录值的对话窗,利用这个窗口可以对某一个列重新赋值5.重新定重新定义记录的范的范围(Recode Range)由数据(Data)=变换(Transform)=记录范围(Recode Range),将显示重新定义记录范围的对话窗,利用这个窗口可以对某一个列按照一定的区域
28、重新赋值.第45页/共96页46数据变换数据变换在编辑模式下在编辑模式下6.转换变量类型(Convert Type.)由 数据(Data)=变换(Transform)=转换类型(Convert Type.),将显示转换变量类型对话窗,利用这个窗口来指定将转换的变量(把数值型转换为字符型,或反之).7.计算算对数数(Log(Y):先选中一数值变量,由数据(Data)=变换(Transform)=Log(Y),对该变量进行对数变换,并得到新的变量。第46页/共96页47数据变换数据变换在编辑模式下在编辑模式下8.计算平方根(Sqrt(Y):先选中一数值变量,由 数据(Data)=变换(Transf
29、orm)=Sqrt(Y),对该变量进行求平方根变换,并得到新的变量。9.计算倒数算倒数(1/Y):先选中一数值变量,由数据(Data)=变换(Transform)=1/Y,对该变量进行求倒数变换,并得到新的变量。第47页/共96页48数据变换数据变换在编辑模式下在编辑模式下10.计算平方(Y*Y):先选中一数值变量,由数据(Data)=变换变换(Transform)=Y*Y,对该变量进行求平方变换,并得到新的变量.11.计算指数算指数(Exp(Y):先选中一数值变量,由数据(Data)=变换变换(Transform)=Exp(Y),对该变量进行求指数变换,并得到新的变量。第48页/共96页49
30、合并数据表合并数据表 合并数据表功能是版本8新增加的功能.可按列来合并数据表,或者按行连接数据表.(1)由数据数据(Data)=合并表(Combine Tables)=按列合并按列合并(Merge by Columns)可将指定的几个数据表由By变量匹配合并.(2)由数据数据(Data)=合并表(Combine Tables)=按行合并按行合并(Concatenate by Rows)可将指定的几个数据表按行串接成新数据表.第49页/共96页50合并数据表合并数据表AB AB AB合并表合并表数据串接数据串接SAS SAS 数据集数据集SAS SAS 数据集数据集数据并接数据并接第50页/共9
31、6页51合并数据表合并数据表串接SAS数据集-简单连接NUM VARA 1 A1 2 A2 5 A3串接(Concantenate)A:B:NUM VARA VARB 1 A1 2 A2 5 A3 3 B1 4 B2 6 B3 COMBINE:NUM VARB 3 B1 4 B2 6 B3把第二个数据集把第二个数据集B B的观测串接在第的观测串接在第一个数据集一个数据集A A的所的所有观测后面有观测后面第51页/共96页52NUM VARB 3 B1 4 B2 6 B3合并数据表合并数据表串接SAS数据集-插入式连接NUM VARA 1 A1 2 A2 5 A3串接(Interleave)A:
32、B:NUM VARA VARB 1 A1 2 A2 3 B1 4 B2 5 A3 6 B3 COMBINE:按两个数据集按两个数据集A A和和B B的共同变量的共同变量NUM的值的值排次排次序后串接在一序后串接在一起起(analyst41.sas)第52页/共96页53 合并数据表合并数据表串接SAS数据集在Analyst环境下要串接数据集可在下拉菜单选:(1)数据数据(Data)合并表合并表(Combine Tables)按行连接按行连接(Concatenate by Rows)选要串接的数据集选要串接的数据集选选byby变量变量(2)选要串接的数据集选要串接的数据集(3)(3)指定是简单连
33、接还是插指定是简单连接还是插入式连接入式连接(4)(4)选择串接的变量名选择串接的变量名第53页/共96页54 合并数据表合并数据表并接并接SASSAS数据集数据集-匹配合并匹配合并 NUM VARA 1 A1 2 A2 3 A3NUM VARB 1 B1 2 B2 4 B3并接(Match Merge)C:D:NUM VARA VARB 1 A1 B1 2 A2 B2 3 A3 4 B3COMBINE:按两个数据集按两个数据集C C和和D D的的共同变量共同变量NUM的相的相同值同值匹配合并匹配合并.(analyst42.sas)第54页/共96页55合并数据表合并数据表并接SAS数据集在A
34、nalyst环境下要并接数据集可在下拉菜单选:(1)数据数据(Data)合并表合并表(CombineTables)按列合并按列合并Merge by Columns 选选byby变量变量选并接数据集选并接数据集(2)选并接的数据集选并接的数据集(3)(3)指定并接的方式指定并接的方式(有三有三种种:见右边屏幕的中间见右边屏幕的中间)(4)(4)选选byby变量变量(5)(5)选择并接的变量名选择并接的变量名第55页/共96页56数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集 当希望把数据表中的某些列变为行,行变为列时,可用此项功能.在浏览模式下,由 数据数据(Data)=转置转置(Tra
35、nspose),则显示转置对话窗,在这里可以规定将被转置的一些(变量)列(Transpose)名字;还可以规定一个变量(Group by),用于转置时按该变量的不定,记录源变量名的列名也可以规定,当然也可以用缺省名字.第56页/共96页57数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集例置数据集例1 例例1 1:SASSAS数据集数据集produprodu中包含三种产品中包含三种产品从从20022002年年1 1月开始共月开始共1515个月的销售数据,即三个月的销售数据,即三个观测个观测1616个变量(个变量(3 3行行1616列)的列)的SASSAS数据集,数据集,其中变量其中变量L
36、IMELIME记录产品号。为了分析三种产记录产品号。为了分析三种产品的销售量如何随时间而变化的规律,首先品的销售量如何随时间而变化的规律,首先应把该数据集转化为应把该数据集转化为3 3个变量(即三种产品)个变量(即三种产品)1515个观测(即个观测(即1515个月份的销售量)的数据个月份的销售量)的数据;在在转化后的数据集中还要求加上日期变量转化后的数据集中还要求加上日期变量DATEDATE。(analyst51.sas)第57页/共96页58数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集-例1转置数据集数据集ProduAnalyst:数据(Data)转置(Transpose)第58页
37、/共96页59数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤1.1.启动启动“分析家分析家”,并打开数据集并打开数据集ProduProdu;2.2.选选 数据(Data)转置(Transpose);3.在在转置窗口下,置窗口下,选中想要中想要转置的置的变量(量(这里是里是t1t15),然后点),然后点击Transpose,即即把把选中的中的变量送到量送到Transpose窗口内;窗口内;规定转置后列变量的名字,如规定列变量名的前规定转置后列变量的名字,如规定列变量名的前缀为缀为PRODU,缺省时前缀名字为缺省时前缀名字为COL;规定存放转置后源变量的列名字,缺省时名字为规定存
38、放转置后源变量的列名字,缺省时名字为_SOURSE_;按按OK键键.第59页/共96页60数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤4.存存贮转置后的数据置后的数据为一新的一新的SAS数据集数据集 文件文件(File)=用用SASSAS名字另存为名字另存为=选择逻辑库,并并规定数据集的名字定数据集的名字(如如Product)后按后按保存保存键.5.加工数据集加工数据集Product;因因转置后生成的数据集没有日期置后生成的数据集没有日期变量量Date,以下步以下步骤就是用来增加一个日期就是用来增加一个日期变量量.打开打开刚生成的生成的SAS数据集数据集Product,并并
39、转换为编辑模式模式;选选数据(Data)变换(Transform)计算(Compute)在以下出现的Compute:Product窗口做以下的选择:第60页/共96页61数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤(计算公式由算公式由SAS日期日期时间函数函数给出出)第61页/共96页62数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤选择正确后,按OK键,则在数据表窗口变量列后面生成新变量Date,但此时该变量的值为日期时间相应的数值.选中变量Date,点右键,在弹出的子菜单中选Properties,然后在出现的列属性Column Properties对话
40、框中修改输出格式为Format:MONYY7.;按按OK键.变量_SOURSE_在这里没有用,可以删除.把符合要求的数据表存为SAS数据集(如仍用名字Product).第62页/共96页63数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集置数据集-例例2 例例2 2:SASSAS数据集数据集transtrans中包含某企业从中包含某企业从19811981年至年至19951995年的销售资料年的销售资料.该数据集的每个该数据集的每个观测记录年度及该年观测记录年度及该年1212个月的销售量个月的销售量,共有共有1515行行1313列列.为了分析该企业月销售量如何随时间为了分析该企业月销售量如
41、何随时间而变化的规律,请把该数据集转化为而变化的规律,请把该数据集转化为2 2个变量个变量(DATEDATE和和SALESSALES)180180个观测(即个观测(即1515年年 1212个月)个月)的数据的数据.(analyst52.sas)第63页/共96页64数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集-例2按年转置并加日期第64页/共96页65数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤1.1.启动启动“分析家分析家”,并打开数据集并打开数据集transtrans;数据(Data)转置(Transpose);3.在在转置窗口下,置窗口下,选中想要中想要转置
42、的置的变量(量(这里是里是jandec),然后点),然后点击Transpose,即即把把选中的中的变量送到量送到Transpose窗口内;窗口内;选Group by变量(量(这里是里是YEAR),然后点),然后点击 Group by,即即把把选中的中的变量送到量送到Group by窗口内;窗口内;规定转置后列变量的名字规定转置后列变量的名字,如规定列变量的前缀名如规定列变量的前缀名为为SALES;规定转置后源变量的列名字,缺省时名字为规定转置后源变量的列名字,缺省时名字为_SOURSE_;按按OK键键.第65页/共96页66数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤第66
43、页/共96页67数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤4.存存贮按年按年转置后的数据置后的数据为一新的一新的SAS数据集数据集 文件文件(File)=用用SASSAS名字另存为名字另存为=选择逻辑库,并并规定数据集的名字定数据集的名字(如如Trans1)后按后按保存保存键.5.加工数据集加工数据集Trans1;因因转置后生成的数据集没有日期置后生成的数据集没有日期变量量Date,以下步以下步骤就是用来增加一个日期就是用来增加一个日期变量量.打开打开刚生成的生成的SAS数据集数据集Trans1,并并转为编辑模模式式;选选数据(Data)变换(Transform)计算(C
44、ompute)在Compute:Product窗口窗口选择合适的日期合适的日期时间函数函数,给出的出的计算公式算公式,并并计算出算出DATE的数的数值.第67页/共96页68数据的转置及堆叠和拆分数据的转置及堆叠和拆分转置数据集的具体步骤 选中中变量量Date,点右点右键,在在弹出的下拉菜出的下拉菜单中中选Properties,然后在出然后在出现的列属性的列属性Column Properties对话框中修改框中修改输出格式出格式为Format:YYMMDD8.;按按OK键.变量量_SOURSE_和和YEAR在在这里没有用里没有用,可以可以删除除.把符合要求的数据表存把符合要求的数据表存为SAS
45、数据集数据集(如如用名字用名字Trans2).第68页/共96页69数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列堆叠列(Stacking Column)把选中的几个(变量)列的数值叠加为一列(即每一个观测行叠加后变成几个观测行).在浏览模式下,由 数据(Data)=堆叠列(Stacking Columns)则显示叠加列的对话窗,在这里可以规定将叠加为一列的哪几个变量列的名字;还可以规定叠加后新列的名字,及规定一个名字用于记录叠加的这些列名.当数据表中每个观测的一些数值是对同一个对象重复几次测量得到的,叠加列的功能特别有用(见pr0数据集).第69页/共96页70数据
46、的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子堆叠列例子 例3.数据集PRO记录了27个人在8岁,10岁,12岁,14岁的生长指数(用Y1Y4表示).因分析处理的需要,希望把每一行记录(观测),如 person sex y1 y2 y3 y4 1 F 21 20 21.5 23加工为 person sex age y 1 F 8 21 1 F 10 20 1 F 14 23 加工后生成的新数据集PR包含有27 4=108行4列.(analyst53.sas)第70页/共96页71数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子的具体步骤堆叠
47、列例子的具体步骤1.1.启动启动“分析家分析家”,并打开数据集并打开数据集PRoPRo;数据(Data)堆叠列堆叠列(Stacking Column);3.在堆叠列窗口下,选中想要堆叠的变量(这里是Y1Y4),然后点击Stack,即把选中的变量送到Stack窗口内;规定堆叠所成的新列的名字为规定堆叠所成的新列的名字为Y(缺省时名字为缺省时名字为_Stack_);规定记录被堆叠的源变量的名字规定记录被堆叠的源变量的名字,缺省时名字为缺省时名字为_Source_;按按OK键键.第71页/共96页72数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子的具体步骤堆叠列例子的具
48、体步骤Y第72页/共96页73数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子的具体步骤堆叠列例子的具体步骤4.存贮堆叠后的数据为一新的SAS数据集 文件文件(File)=用用SASSAS名字另存为名字另存为=选择逻辑库,并规定数据集的名字(如PR1)后按保存键.5.加工数据集PR1;因堆叠后生成的数据集没有记录年龄的变量AGE,以下步骤就是用来增加一个年龄变量.打开刚生成的打开刚生成的SAS数据集数据集PR1,并转为编辑模式;选选数据(Data)变换(Transform)记录值(Recore)在出现的记录值信息窗口修改新列的名字 为AGE;第73页/共96页74数
49、据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-堆叠列例子的具体步骤堆叠列例子的具体步骤第74页/共96页75数据的转置及堆叠和拆分数据的转置及堆叠和拆分例例2的另一解法的另一解法-堆叠列的具体步骤堆叠列的具体步骤1.1.启动启动“分析家分析家”,并打开数据集并打开数据集transtrans;数据(Data)堆叠列堆叠列(Stacking Column);3.在堆叠列窗口下,选中想要堆叠的变量(这里是jandec),然后点击Stack,即把选中的变量送到Stack窗口内;规定堆叠所成的新列的名字为规定堆叠所成的新列的名字为Sales(缺省时名字为缺省时名字为_Stack_);规
50、定记录被堆叠的源变量的名字规定记录被堆叠的源变量的名字,缺省时名字为缺省时名字为_Source_;按按OK键键.第75页/共96页76数据的转置及堆叠和拆分数据的转置及堆叠和拆分例例2的另一解法的另一解法-堆叠列的具体步骤堆叠列的具体步骤 文件文件(File)=用用SASSAS名字另存为名字另存为=选择逻辑库,并规定数据集的名字(如trans1)后按保存键.5.加工数据集trans1;因转置后生成的数据集没有日期变量Date,用与例2类似的方法来增加一个日期变量.第76页/共96页77数据的转置及堆叠和拆分数据的转置及堆叠和拆分加工数据集加工数据集-拆分列(Splitting Column)把