《sas简单操作步骤(共12页).docx》由会员分享,可在线阅读,更多相关《sas简单操作步骤(共12页).docx(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上SAS数据分析完整笔记1.SAS INSIGHT启动:方法1:SolutionAnalysisInteractive Date Analysis方法2:在命令栏内输入insight方法3:程序编辑窗口输入以下代码,然后单击Submit按钮;Proc insight;Run;1.1一维数据分析用sas insight做直方图、盒形图、马赛克图。直方图:AnalysisHistogram/Bar Chart盒形图:AnalysisBox plot马赛克图:AnalysisBox plot/Mosaic plot(Y)1.2二维数据分析散点图:AnalysisScatter
2、y plot(Y X)曲线图:AnalysisLine plot(Y X)1.3三维数据分析旋转图:AnalysisRotationg Plot曲面图:AnalysisRotationg Plot设置Fit Surface等高线图:AnalysisCountor plot1.4分布分析包括:直方图、盒形图、各阶矩、分位数表,直方图拟合密度曲线,对特定分布进行检验。1.4.1AnalysisDistribution(Y)第一部分为盒形图,第二部分为直方图,第三部分为各阶矩,第四部分为分位数表。1.4.2添加密度估计A:参数估计:给出各种已知分布(正态,指数等),只需要对其中参数进行估计;Curv
3、esParametric DensityB:核估计:对密度函数没有做假设,曲线性状完全依赖于数据;CurvesKernel Density1.4.3分布检验CurvesCDF confidence bandCurvesTest for Distribution1.5曲线拟合AnalysisFit(Y X):分析两个变量之间的关系1.6多变量回归AnalysisFit(Y X)1.7方差分析AnalysisFit(Y X)1.8相关系数计算AnalysisMultivariate1.9主成分分析AnalysisMultivariate2.SAS ANALYST启动:方法1:SolutionAna
4、lysisAnalyst方法2:在命令栏内输入analyst2.1分类计算统计量:DataSummarize by group2.2随机抽样:DataRandom Sample2.3生成报表:ReportTables2.4变量计算:DateTransform2.5绘制统计图2.5.1条形图:GraphBar ChartHorizontal2.5.2饼图:GraphPie Chart2.5.3直方图:GraphHistogram2.5.4概率图:GraphProbality plot2.5.5散点图:GraphScatter plot2.6统计分析与计算2.6.1计算描述性统计量Statisti
5、csDeiveSummart Statistics只计算简单统计量StatisticsDeiveDistribution可计算一个变量的分布信息StatisticsDeiveCorrelations可计算变量之间的相关关系StatisticsDeiveFrequency counts可计算频数2.6.2列联表分析StatisticsTable Analysis2.7假设检验2.7.1单样本均值Z检验:检验单样本均值与某个给定的数值之间的关系StatisticsHypothesis testsOne-Sample Z-test for a mean2.7.2单样本均值t检验:适用于不了解变量的方
6、差情形推断该样本来自的总体均数与已知的某一总体均属0是否相等StatisticsHypothesis testsOne-Sample t-test for a mean2.7.3单样本比例检验:检验取离散值的变量取某个值的比例StatisticsHypothesis testsOne-Sample test for a proportion2.7.4单样本方差检验:检验样本方差是否等于给定的值。零假设方差等于某个给定的。StatisticsHypothesis testsOne-Sample test for a variance2.7.5两样本均值t检验:独立的两个总体的均值是否相等或者是否
7、相差给定的值StatisticsHypothesis testsTwo-Sample t-test for means2.7.6成对样本均值t检验:成对样本检验中总体是相关的。StatisticsHypothesis testsTwo-Sample paired t-test for means2.7.7两样本比例检验:检验两个总体中某个比例的值是否相等。StatisticsHypothesis testsTwo-Sample test for proportions2.7.8两样本方差检验StatisticsHypothesis testsTwo Sample test for varian
8、ce2.8ANOVA过程2.8.1单因素ANOVA过程StatisticsANOVAOne-Way Anova2.8.2非参数的单因素方差分析:适用于正态分布假定或方差相等假设不能满足的单因素问题StatisticsANOVAnonparameter one-way Anova testWilcoxon法、Median法、Van der Waerden法、Savage法。2.8.2因素方差分析:实验结果是连续数值而分类变量是两个以上的离散型数值。StatisticsANOVAFactorial Anova2.8.3线性模型:用最小二乘法拟合一般线性模型StatisticsANOVALinear
9、 Model2.9回归分析:StatisticsRegression2.9.1simple回归:简单一类回归分析,单一的自变量,单一的因变量,模型可以是一次、二次、三次。StatisticsRegressionsimple2.9.2linear回归:线性回归,回归模型可以有多个因变量,多个自变量,但是对因变量分别进行回归StatisticsRegressionlinear2.9.3logistic回归:用于解决因变量是一个二元变量StatisticsRegressionlogistic3.报表以及图形输出3.1 print过程Proc print data = sasuser.score;/数
10、据库.数据集Run;Proc print data = sasuser.score;Var name math Chinese;/变量Run;Proc print data = sasuser.scorenoobs;/去掉第一列(观测序号)Var name math Chinese;Run;Procprintdata=sasuser.score;Where sex in(f);/通过where语句Run;Proc print data =sasuser.score noobs label;Title女生成绩单;Label name =姓名Sex =性别Math =数学Chinese =语文En
11、glish =英语;Where sex in(f);Run;Title“the sas system”;/恢复系统标题Procprintdata =sasuser.score;Footnote =分数列表;/加分数列表的脚注Run;Proc sortdata =sasuser.score;Bysex;Run;Procprintdata =sasuser.score;/使用by分组输出前用sort排序By sex;Run;Procprintdata =sasuser.score;Sum math;Run;3.2 tabulate过程Proc tabulate data =数据集名称;Class分
12、类变量;Var分析变量;Table页面说明 行维说明 列维说明/选项;Run;3.3 sort过程Proc sort data =数据集名称;/默认升序排列By变量名;Run;Proc sort data =数据集名称;Bydescending变量名;/降序排列Run;3.4means过程:数量(N)、均值(Mean)、标准差(Std Dev)、最大值(Maximum)、最小值(Minimum)Proc meansdata = sasuser.stock;Varprice;Run;3.5 univariate过程Proc univariate data =数据集;Var分析变量;Run;结果:
13、Moments:统计量的各阶矩,例如一阶矩就是均值,二阶矩就是方差等;Basic Statistical Measures:基本统计量;Tests for ocation:检验均值是否为零;Quantiles:分位数表;Extreme Observations:极端观测值。3.6 freq过程:离散变量的分布情况Proc freq data =数据集名;Tables变量名;Run;结果:变量取值、频数、百分比、累计频数、;累计百分比3.7 corr过程:相关系数Proc corr data =数据集;Var变量名变量名;Run;结果:简单统计量相关系数及p值3.8 gplot过程:绘制散点图和
14、曲线图,绘制回归曲线。Proc gplotdata =数据集名称;Symbol曲线类型;Plot竖轴变量*横轴变量;Run;Proc gplot data = sasuser.score;Symbol I = nonev=star;Plot English*Chinese;Run;3.9gchart过程:绘制直方图、饼图、三维直方图等。Proc gchart data =数据集名称;Vbar/pie/block =变量;Run;3.10 G3D过程绘制三维曲面Proc g3d data =数据集;Plot变量x*变量y=变量z;Run;gcontour过程:画出曲面的等高线Proc gcont
15、our data =数据集名;Plot x*y=z;Run;4.基本统计分析4.1正态性检验:univariate过程Proc univariate data= sasuser.stock normal;Vareps;Run;Proc univariate data= sasuser.stock normal;Vareps;Histogram eps;/画出直方图Probplot eps;/画出概率分布图Run;4.2单变量均值检验4.2.1如果一个变量服从正态分布,那么可以用t检验来对变量进行均值检验Proc ttest data =数据集ho =均值;Var检验变量;Run;4.2.2t检
16、验还可以检验方差相同的两个独立样本均值是否相等Proc ttest data =数据集;Class分类变量;Var检验变量;Run;结果第一部分简单统计量第二部分t检验结果第三部分两者方差是否相等检验T检验要求两个独立样本都必须服从正态分布,如果不服从正态分布,则无法进行t检验。这时可用非参数的方法,常用的非参数方法是NPAR1WAY过程,它是noparameter 1 way缩写。4.3成对总体均值检验4.4回归分析:reg(回归)过程、rsreg(二次响应面回归)过程、orthoreg(病态数据回归)过程、nlin(非线性回归)过程、transreg(变换回归)过程、calis(线性结果方
17、程和路径分析)过程、glm(一般线性回归)过程、genmod(广义线性回归)过程4.4.1 REG过程Proc reg data =输入数据集 选项;Var变量列表;Model因变量=自变量列表;Print输出结果;Plot诊断图形;Run;4.4.2 nlin过程指明模型的表达式并给定系数初值4.4.3glm过程:使用最小二乘法回归线性模型,还可以进行回归,分差,协方差,多变量方差、偏相关系数分析4.5方差分析4.5.1单因素方差分析Proc anova data =数据集名称;Class因素;Model实验结果=因素;Run;Proc anova data =数据集名称;Class因素;M
18、odel实验结果=因素;Meansbrand;Run;Proc anova data =数据集名称;Class因素;Model实验结果=因素;Meansbrand/t;/t检验Run;Proc anova data =数据集名称;Class因素;Model实验结果=因素;Meansbrand/bon;/bonferroni t检验控制第一类错误的概率,但是具有较大第二类错误概率Run;Proc anova data =数据集名称;Class因素;Model实验结果=因素;Meansbrand/regwq;/regwq检验控制第一类错误的概率Run;Proc anova data =数据集名称;Class因素;Model实验结果=因素;Meansbrand/tukey;/tukey检验控制第一类错误的概率,但是第二类错误概率通常高于regwq检验Run;4.5.2多因素方差分析4.5.3列联表检验Proc freq data =数据集;Tables因素a*因素b / chisq;Weight实验结果;Run;5相关知识因变量Depender(Y)自变量Independent(X1X2)专心-专注-专业