《常用生物统计方法的SAS程序 一、SAS系统简介二、SAS系统的启动与关闭三、SAS程序结构、程序的输入、修改 调试和运行 四、常用生物统计方法的SAS程序—t检验—方差分析—线性回归与相关分析.ppt》由会员分享,可在线阅读,更多相关《常用生物统计方法的SAS程序 一、SAS系统简介二、SAS系统的启动与关闭三、SAS程序结构、程序的输入、修改 调试和运行 四、常用生物统计方法的SAS程序—t检验—方差分析—线性回归与相关分析.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、常用生物统计方法的SAS程序 一、SAS系统简介二、SAS系统的启动与关闭 三、SAS程序结构、程序的输入、修改 调试和运行 四、常用生物统计方法的SAS程序 t检验 方差分析 线性回归与相关分析 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望一、一、SAS系统简介系统简介 SAS(Statistical Analysis System)是美国使用是美国使用最为广泛的最为广泛的三大著名统计分析软件(三大著名统计分析软件(SAS,SPSS,SYSTAT)之一;之一;
2、1966年美国年美国North Carolina 州立大学开始开发州立大学开始开发 目前国际上最流行的一种目前国际上最流行的一种大型统计分析系统大型统计分析系统 统计分析的统计分析的标准软件标准软件 其基本部分是其基本部分是SAS/BASE软件,在此基础上可软件,在此基础上可根据需要加上根据需要加上SAS系统的其他模块系统的其他模块 SAS/STAT(统计分析)(统计分析);SAS/ETS(经济(经济预测或时间序列分析);预测或时间序列分析);SAS/QC(质量控(质量控制管理);制管理);SAS/OR(运筹学);(运筹学);SAS/IML(矩阵运算);(矩阵运算);SAS/GRAPH(绘(绘
3、图)等图)等 信息存储简单(能读取任何形式的数据)信息存储简单(能读取任何形式的数据)语言编程能力强语言编程能力强 对数据连续处理对数据连续处理 统计分析方法丰富,使用简单统计分析方法丰富,使用简单 SAS过程傻瓜系统过程傻瓜系统二、二、SAS系统的启动与关闭系统的启动与关闭 (一)启动(一)启动 在在WINDOWS操作系统中,直接用操作系统中,直接用鼠标双击桌面上鼠标双击桌面上SAS系统的快捷键图标,即进系统的快捷键图标,即进入入SAS系统。系统。SAS系统软件有时间租期限制,因此只有机器时间在系统软件有时间租期限制,因此只有机器时间在软件有效期内才能运行软件有效期内才能运行 OUTPUT(
4、SAS结果输出窗口)结果输出窗口)LOG(SAS日志窗口,随着日志窗口,随着SAS语句的执行,语句的执行,显示出显示出SAS系统的信息和已执行的语句)系统的信息和已执行的语句)PGM(SAS程序编辑窗口)程序编辑窗口)(二)退出(二)退出 四、四、SAS程序结构程序结构(一)程序结构(一)程序结构 在在SAS系统中任何一个完整的处系统中任何一个完整的处理过程均可分为两大步理过程均可分为两大步数据步和过程步数据步和过程步数据步数据步将不同来源的数据读入将不同来源的数据读入SAS系统建立系统建立起起SAS数据集。由数据集。由DATA语句语句开始,以开始,以RUN语句语句结束。结束。数据可以由外部或
5、过程读入;或者数据可以由外部或过程读入;或者由由CARDS语句语句开始,开始,直接输入数据直接输入数据,数据输入完后提行单,数据输入完后提行单独加独加“;”结束结束 过程步过程步调用调用SAS系统中已编好的各种过程系统中已编好的各种过程来处理和分析数据集中的数据。来处理和分析数据集中的数据。每一个过程步均以每一个过程步均以PROC语句语句开始,开始,RUN语语句结束,并且每个语句后均以句结束,并且每个语句后均以“;”结束。结束。(二)程序的输入、修改调试和运行(二)程序的输入、修改调试和运行 SAS程序只能在程序只能在PGM窗口输入、修改,可在窗口输入、修改,可在各行的任何位置开始各行的任何位
6、置开始SAS语句的书写。一个语语句的书写。一个语句可以连续写在几行中,一行中也可以同时写句可以连续写在几行中,一行中也可以同时写上几个语句,但每个语句后面必须用上几个语句,但每个语句后面必须用“;”隔隔开。开。当一个程序输入完后,发送程序的命令为当一个程序输入完后,发送程序的命令为F10功能键或功能键或SUBMIT。当程序发送到。当程序发送到SAS系统后,系统后,PGM的程序语句全部自动清除,的程序语句全部自动清除,LOG窗口将窗口将逐步记下程序运行的过程和出现的错误信息逐步记下程序运行的过程和出现的错误信息(用红色提示错误)。(用红色提示错误)。如果过程步没有错误如果过程步没有错误,运行完成
7、后,通常会,运行完成后,通常会在在OUTPUT窗口打印出结果窗口打印出结果 如果程序运行出错,如果程序运行出错,则需要在则需要在PGM窗口用窗口用RECALL(或(或F9)命令调回已发送的程序进行)命令调回已发送的程序进行修改。修改。四、常用生物统计方法的四、常用生物统计方法的SASSAS程序程序(一)(一)t 检验检验 1 1、样本平均数与总体平均数的差异显著性检验样本平均数与总体平均数的差异显著性检验(教材教材【例【例5.1】)DATA A;INPUT y;y=y-4.50;cards;4.33 4.62 3.89 4.14 4.78 4.64 4.52 4.48 4.55 4.26;PR
8、OC MEANS N MEAN STDERR T PRT;RUN;程程序序说说明明:样样本本平平均均数数与与总总体体平平均均数数的的差差异异显显著著性性检检验验可调用可调用MEANS过程。过程。DATA语句语句产生临时数据集产生临时数据集A,表明数据步的开始;,表明数据步的开始;INPUT语语句句指指明明读读取取变变量量y,表表示示读读入入一一条条观观测测值值后后不换行,连续读入数据,减少数据输入行;不换行,连续读入数据,减少数据输入行;CARDS语语句句表表明明以以下下为为数数据据行行,数数据据行行下下的的“;”表表示数据行结束;示数据行结束;PROC MEANS 语语句句指指明明调调用用M
9、EANS过过程程对对数数据据集集A进进行行分分析析,输输出出样样本本含含量量N、平平均均数数MEAN、平平均均数数的标准误的标准误STDERR、学生氏、学生氏T值和值和t值概率值概率PRT;RUN语句语句表示过程步结束,开始运行过程步。表示过程步结束,开始运行过程步。2 2、配对试验资料的配对试验资料的t检验检验(教材(教材【例【例5.5】)DATA B;INPUT ID x1 x2;d=x1-x2;CARDS;1 37.8 37.9 2 38.2 39.0 3 38.0 38.9 4 37.6 38.4 5 37.9 37.9 6 38.1 39.0 7 38.2 39.5 8 37.5 3
10、8.6 9 38.5 38.8 10 37.9 39.0;PROC MEANS MEAN STDERR T PRT;VAR d;RUN;3 3、非配对试验资料的非配对试验资料的t检验检验(教材(教材【例【例5.3】)DATA C;INPUT breed y;CARDS;1 57 2 89 1 120 2 36 1 101 2 82 1 137 2 50 1 119 2 39 1 117 2 32 1 104 2 57 1 73 2 82 1 53 2 96 1 68 2 31 1 118;PROC TTEST;CLASS breed;VAR y;RUN;(二)方差分析 对于一般的方差分析(平衡
11、资料,即各处对于一般的方差分析(平衡资料,即各处理重复数相等)可用理重复数相等)可用ANOVA过程;对于非平衡过程;对于非平衡资料(各处理重复数不等)的方差分析可用资料(各处理重复数不等)的方差分析可用GLM过程。过程。1.单因素试验(各处理重复数相等,单因素试验(各处理重复数相等,教材教材【例【例6.1】)2.单因素试验(各处理重复数不等,单因素试验(各处理重复数不等,教材教材【例【例6.3】)3.两因素交叉分组单独观察值两因素交叉分组单独观察值(教材教材【例【例6.4】)4.两因素交叉分组重复观察值两因素交叉分组重复观察值(教材教材【例【例6.5】)5.两因素系统分组次级样本含量相等两因素
12、系统分组次级样本含量相等(教材教材【例【例6.6】)6.随机单位组试验资料随机单位组试验资料(教材【例(教材【例12.3】)】)7.拉丁方试验资料拉丁方试验资料(教材【例(教材【例12.4】)】)教材教材【例【例6-1】DATA E;INPUT TR$y;cards;A1 15 A1 16 A1 15 A1 17 A1 18 A2 45 A2 42 A2 50 A2 38 A2 39 A3 30 A3 35 A3 29 A3 31 A3 35 A4 31 A4 28 A4 20 A4 25 A4 30 A5 40 A5 35 A5 31 A5 32 A5 30;PROC anova;CLASS
13、 TR;model y=TR;MEANS TR/T;RUN;DATA F;INPUT BREED$y;cards;B1 21.5 B1 19.5 B1 20.0 B1 22.0 B1 18.0 B1 20.0 B2 16.0 B2 18.5 B2 17.0 B2 15.5 B2 20.0 B2 16.0 B3 19.0 B3 17.5 B3 20.0 B3 18.0 B3 17.0 B4 21.0 B4 18.5 B4 19.0 B4 20.0 B5 15.5 B5 18.0 B5 17.0 B5 16.0;PROC GLM;CLASS BREED;model y=BREED;MEANS BR
14、EED/T;RUN;DATA F;INPUT A$B$y;cards;A1 B1 3.5 A1 B2 2.3 A1 B3 2.0 A2 B1 2.6 A2 B2 2.0 A2 B3 1.9 A3 B1 2.0 A3 B2 1.5 A3 B3 1.2 A4 B1 1.4 A4 B2 0.8 A4 B3 0.3;PROC ANOVA;CLASS A B;model y=A B;MEANS A B/DUNCAN;RUN;DATA CaP;DO a=1 to 4;DO b=1 to 4;DO n=1 to 3;input y;output;end;end;end;DROP n;CARDS;22.0 2
15、6.5 24.4 30.0 27.5 26.0 32.4 26.5 27.0 30.5 27.0 25.1 23.5 25.8 27.0 33.2 28.5 30.1 38.0 35.5 33.9 26.5 24.0 25.0 30.5 26.8 25.5 36.5 34.0 33.5 28.0 30.5 24.6 20.5 22.5 19.5 34.5 31.4 29.3 29.0 27.5 28.0 27.5 26.3 28.5 18.5 20.0 19.0;PROC ANOVA;CLASS A B;MODEL y=A B A*B;RUN;DATA G;DO a=1 to 3;DO b=1
16、 to 3;DO n=1 to 2;input y;output;end;end;end;DROP n;CARDS;82.5 82.4 87.1 86.5 84.0 83.9 86.6 85.8 86.2 85.7 87.0 87.6 82.0 81.5 80.0 80.5 79.5 80.3;PROC ANOVA;CLASS A B;MODEL y=A B(A);RUN;DATA R;INPUT T$B$X;CARDS;A1 B1 205 A1 B2 168 A1 B3 222 A1 B4 230A2 B1 230 A2 B2 198 A2 B3 242 A2 B4 255A3 B1 252
17、 A3 B2 248 A3 B3 305 A3 B4 260A4 B1 200 A4 B2 158 A4 B3 183 A4 B4 196A5 B1 265 A5 B2 275 A5 B3 315 A5 B4 282;PROC GLM;CLASS T B;MODEL X=T B;MEANS T/DUNCAN;RUN;DATA L;INPUT T$ROW COL X;CARDS;D 1 1 23 E 1 2 21 A 1 3 24 B 1 4 21 C 1 5 19A 2 1 22 C 2 2 20 E 2 3 20 D 2 4 21 B 2 5 22E 3 1 20 A 3 2 25 B 3
18、3 26 C 3 4 22 D 3 5 23B 4 1 25 D 4 2 22 C 4 3 25 E 4 4 21 A 4 5 23C 5 1 19 B 5 2 20 D 5 3 24 A 5 4 22 E 5 5 19;PROC GLM;CLASS T ROW COL;MODEL X=T ROW COLl;MEANS T/DUNCAN;RUN;(三)一元线性回归与相关分析(三)一元线性回归与相关分析(教材(教材【例【例8.1】)DATA G;INPUT x y;CARDS;80 2350 86 2400 98 2720 90 2500 120 3150102 2680 95 2630 83
19、2400 113 3080 105 2920110 2960 100 2860;PROC REG CORR;MODEL y=x;RUN;(四)协方差分析(四)协方差分析(教材(教材【例【例10.1】)DATA K;INPUT T$X Y;CARDS;CK 1.50 12.40 CK 1.85 12.00 CK 1.35 10.80CK 1.45 10.00 CK 1.40 11.00 CK 1.45 11.80CK 1.50 12.50 CK 1.55 13.40 CK 1.40 11.20CK 1.50 11.60 CK 1.60 12.60 CK 1.70 12.50 1 1.35 10.
20、20 1 1.20 9.40 1 1.45 12.20 1 1.20 10.30 1 1.40 11.30 1 1.30 11.40 1 1.15 12.80 1 1.30 10.90 1 1.35 11.60 1 1.15 8.50 1 1.35 12.20 1 1.20 9.30 2 1.15 10.00 2 1.10 10.60 2 1.10 10.40 2 1.05 9.20 2 1.40 13.00 2 1.45 13.50 2 1.30 13.00 2 1.70 14.80 2 1.40 12.30 2 1.45 13.20 2 1.25 12.00 2 1.30 12.803 1.20 12.40 3 1.00 9.80 3 1.15 11.603 1.10 10.60 3 1.00 9.20 3 1.45 13.903 1.35 12.80 3 1.15 9.30 3 1.10 9.603 1.20 12.40 3 1.05 11.20 3 1.10 11.00;PROC GLM;CLASS T;MODEL Y=T X/SOLUTION;MEANS T/DUNCAN;LSMEANS T/STDERR PDIFF TDIFF;RUN;