《最新医用sas统计分析(三ppt课件.ppt》由会员分享,可在线阅读,更多相关《最新医用sas统计分析(三ppt课件.ppt(56页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、分类变量的统计推断一、分类变量的统计推断卡方检验卡方检验 在SAS系统中,对分类变量资料的基本统计分析方法主要通过FREQ过程实现的。FREQ过程的主要功能有: 1.产生一维或多维频数表; 2.计算各种表中格子的理论频数、构成比和各种率; 3.对分类变量资料作相应的假设检验。q 四格表资料的卡方检验书中例10-1data chisq1; do r=1 to 2; do c=1 to 2; input f ; output; end; end;cards;63 17 31 68;proc freqFormchar(1,2,7)=|-+;weight f;tables r*c/chisq;ru
2、n; 卡方检验结果 TABLE OF R BY C R C Frequency|二维表每个格子的频数 Percent |每个格子的频数在总频数中的百分比。 Row Pct |行百分数,每格子频数占该行合计频数的百分比。 Col Pct | * 1| 2| Total -+-+-+ 1 | 63 | 17 | 80 | 35.20 | 9.50 | 44.69 | 78.75 | 21.25 | *列百分数,每格子频数占 | 67.02 | 20.00 | 该列合计频数的百分比。 -+-+-+ 2 | 31 | 68 | 99 | 17.32 | 37.99 | 55.31 | 31.31 |
3、68.69 | | 32.98 | 80.00 | -+-+-+ Total 94 85 179 52.51 47.49 100.00 STATISTICS FOR TABLE OF R BY CStatistic DF Value Prob-Chi-Square 1 39.927 0.001Likelihood Ratio Chi-Square 1 41.860 0.001Continuity Adj. Chi-Square 1 38.047 0.001Mantel-Haenszel Chi-Square 1 39.704 0.001Fishers Exact Test (Left) 1.0
4、00 (Right) 1.44E-10 (2-Tail) 1.64E-10Phi Coefficient 0.472Contingency Coefficient 0.427Cramers V 0.472Sample Size = 1792值; 似然比2值; 连续性校正2值; M-H 2值; Fishers 精确概率值; Phi 系数; 列联系数; 可莱姆的V值q 四格表2 值的校正 例 王洁贞主编医学统计学例6.4 表6-3 2种药物治疗白色葡萄球菌败血症结果处 理 有 效 无 效 合 计 甲 药 乙 药 合 计 33(31.02) 6( 7.98) 2(3.98) 3(1.02) 35 9
5、 39 5 44本例有两个格的1T40,故对2值进行校正。程序data chi; do r=1 to 2; do c=1 to 2; input f ; output; end; end;cards; 33 2 6 3 ;proc freq formchar(1,2,7)=|-+; weight f; tables r*c/chisq expected nocol norow nopct;run; R C Frequency | Expected | 1| 2| Total -+-+-+ 1 | 33 | 2 | 35 | 31.023 | 3.9773 | -+-+-+ 2 | 6 | 3
6、| 9 | 7.9773 | 1.0227 | -+-+-+ Total 39 5 44 STATISTICS FOR TABLE OF R BY CStatistic DF Value Prob-Chi-Square 1 5.422 0.020Likelihood Ratio Chi-Square 1 4.367 0.037Continuity Adj. Chi-Square 1 3.026 0.082Mantel-Haenszel Chi-Square 1 5.299 0.021Fishers Exact Test (Left) 0.996 (Right) 0.050 (2-Tail) 0
7、.050Phi Coefficient 0.351Contingency Coefficient 0.331Cramers V 0.351Sample Size = 44WARNING: 50% of the cells have expected counts less than 5. Chi-Square may not be a valid test.q 配对四格表资料的卡方检验 配对四格表资料属于2 2列联表。根据分析的目的可分为关联性检验和差别性检验。 如医学统计学王洁贞主编例6.8 某研究者用甲、乙2种试剂检验132种血清,结果见表6-7,问2种试剂的检验结果有无关系以及有无差别?
8、v关联性检验(独立性检验) 应用一般的2检验H0:甲、乙两试剂的检验结果无关系。 tables语句选择 chisq; 如2检验有统计学意义,通过列联系数(Contingency Coefficient)说明两者的关联性。v差别性检验(一致性检验) 应用McNemars Test H0:两总体的B=C,即两试剂阳性率无差别。TTA22)(当b+c0.05说明总体方向是一致的,P0.05说明总体方向是不一致的。如方向一致可以用总的OR值表示,否则不能用总的OR值表示。v 多层的行列表 程序10-6data chisq2;do hospital=1 to 2; do trt=1 to 2; do e
9、ffect=1 to 3; input f ; output; end; end;end;cards;23 7 2 20 13 518 6 2 13 13 2;proc freq formchar(1,2,7)=|-+;weight f;tables hospital*trt*effect/cmh nopct nocol;run;二、二、 二项分布与二项分布与Poisson分布分布q 二项分布v二项分布的统计说明二项分布的应用条件 1.两分类对立结果资料; 2。试验结果是相互独立,互不影响的。 二项分布的概率函数X=0,1,2,n 。 二项分布的分布函数至多有x例阳性的概率为,即下侧累积概率:
10、至少有x例阳性的概率为,即上侧累积概率:XnxxnnCXP)1 ()(xXnXPxXP0)()(nxXnXPxXP)()(vSAS中二项分布函数SAS中二项分布函数表达式为:probbnml(, n, x);式中 为事件发生的概率,n为样本含量,x为阳性事件个数。表达式计算的结果为发生阳性事件数x的概率。例12-1data jin;p=probbnml(0.5,4,2);q=1-p;proc print;run;结果OBS P Q 1 0.6875 0.3125表明死亡2 的概率(0+1+2的概率)为0.6875;死亡2的概率(3+4的概率)为0.3124。v用二项分布检验治疗效果 例12-3
11、 根据以往的经验用一般疗法治疗某病,其病死率为40%,治愈率为60%。今用某种新药治疗该病人5名,这5名均治愈了。问该项新药是否比一般疗法为优。 当实际率大于理论率时,计算上则累积概率。本例应计算: p=probbnml(0.6,5,5)-probbnml(0.6,5,4)程序12-3data binom2;p=probbnml(0.6,5,5)-probbnml(0.6,5,4);proc print;run; OBS P 1 0.07776假如 10名病人,结果1名死亡,9名治愈,则应计算P(x9)的概率。程序12-4data binom3;p=probbnml(0.6,10,10)-pr
12、obbnml(0.6,10,8);Proc print;Run; OBS P 1 0.046357v求二项分布的概率分布 例12-5 设 =0.5,n=4,求x=0,1,2,3,4的概率data binom4;do r=0 to 4;p=probbnml(0.5,4,r);q=1-p;if r=0 then d=p; elsed=probbnml(0.5,4,r)-probbnml(0.5,4,r-1);output;end;proc print;run;OBS R P Q D 1 0 0.0625 0.9375 0.0625 2 1 0.3125 0.6875 0.2500 3 2 0.68
13、75 0.3125 0.3750 4 3 0.9375 0.0625 0.2500 5 4 1.0000 0.0000 0.0625q Poisson分布v Poisson分布的统计说明Poisson分布的应用条件 同二项分布,Poisson分布是二项分布的特例, 当很小,n很大时,Poisson分布非常接近二项分布。 Poisson分布概率函数(X=0,1,2,) =n Poisson分布的分布函数 下侧累积概率: 上侧累积概率:eXXPX!)(XXPXP) 1()(xXXeXxXP0!)(nxXXeXxXP!)(vSAS中Poisson分布函数SAS中Poisson分布函数表达式为:poi
14、sson( x);式中为均数( =n),x为事件发生个数。表达式计算的结果为发生事件数x的概率。 例12-6 有人观察红细胞计数池中400个小格,数出每小格中红细胞数,其均数为3.6175,试计算每格中恰有细胞数5个的概率及小格数。data poisson1;p=poisson(3.6175,5)-poisson(3.6175,4)d=p*400;proc print;run;OBS P D 1 0.13861 55.4448v样本计数与总体均数差别的统计意义检验 例12-8 已知在一培养液中,有细菌数为每毫升3个,今采集放在5冰箱的1ml培养液的细菌数5个,能否说明培养液中细菌数有增加? 本
15、例=3,x=5 3,计算x5的上则累积概率。 可计算 p=1-p(n4)的概率。Data poisson3;P=1-poisson(3,4);Proc print;Run; OBS P 1 0.18474因 P0.05,尚不能认为培养液中细菌数有增长。 例 某地区以往胃癌发病率为万分之一。现调查10万人,发现3例胃癌病人。试分析该地区现在的胃癌发病率是否低于以往的发病率。 本例=0.001,n=100000,x=3,=1000000.0001=10,现X ,应计算x的下则累积概率。data a;p=poisson(10,3);proc print;run; OBS P 1 0.010336因P
16、0.05,可以认为该地区现在的胃癌发病率低于以往的发病率。 在SAS中,非参数统计主要由univariate过程和npar1way过程来实现,前者在前面的第一讲中已经介绍,它 可以进行配对设计差值的符号秩和检验(Wilcoxon配对法);后者是一个单因素的非参数方差分析过程,可进行成组设计的两样本( Wilcoxon 法)或多样本比(Kruskal-Wallis法 即H检验)的秩和检验。 注意:npar1way过程不能处理按频数输入的资料。对单项有序资料的频数表,可用前面讲到的cmh过程的 Row Mean Scores Differ(行平均分不同)来检验。 SAS不提供非参检验两两比较的方法
17、,其余统计软件里也只有PEMS提供这一功能。 npar1way含意:“npar”是“非参”的英文缩写,“1way”代表一个因素,合起来就是“单因素的非参数检验”。千万不要写成“NPAPLWAY”!qNPAP1WAY 过程的语法格式过程的语法格式PROC NPAR1WAY DATA= 选项 ;CLASS ; 必需必需,指定要分析的分组变量EXACT ; 要求程序在必要时计算确切概率OUTPUT ;指定统计结果的输出数据集VAR ; 指定要分析的因变量BY ; 统计按指定的变量分组进行,要求已排序。PROC过程的选项MISSING 将缺失值也用于统计分析 ANOVA 同时进行方差分析 MEDIAN
18、 要求进行中位数检验 NOPRINT 禁止统计结果在OUTPUT视窗内输出 SAVAGE 要求对样本进行SAVAGE得分分析 WILCOXON 要求进行WILCOXON秩和检验, 通常必选。 在省略所有选项的情况下,SAS系统默认输出所有的统计结果,这恰恰说明了非参数检验方法的不完善。 q 配对资料的符号秩和检验 和配对t检验过程一样,用Proc univariate过程,结果观察Sgn Rank (即T值)Pr=|s| (即P值)。如例13-1 T值=-8.5,P=0.3594。(SAS程序略)q 两样本成组比较程序13-2data npar1;do c=1 to 2;input n;do
19、I=1 to n;input x ; output;end; end;cards;12134 146 104 119 124 161 107 83 113 129 97 123770 118 101 85 107 132 94;proc npar1way wilcoxon;class c;Var x; run; N P A R 1 W A Y P R O C E D U R E Wilcoxon Scores (Rank Sums) for Variable X Classified by Variable C Sum of Expected Std Dev MeanC N Scores Un
20、der H0 Under H0 Score 样本量 各组的秩和 各组的期望秩和 秩和的标准差 各组的平均秩和1 12 140.500000 120.0 11.8269689 11.70833332 7 49.500000 70.0 11.8269689 7.0714286 Average Scores Were Used for Ties Wilcoxon 2-Sample Test (Normal Approximation) (with Continuity Correction of .5) S = 49.5000 Z = -1.69105 Prob |Z| = 0.0908 (按正态近
21、似法作秩和检验,较小样本秩和=49.5,z=-1.69105,P=0.0908) T-Test Approx. Significance = 0.1081 (近似t检验p=0.1081) Kruskal-Wallis Test (Chi-Square Approximation) CHISQ = 3.0044 DF = 1 Prob CHISQ = 0.0830 H检验(近似卡方检验) 2(H)=3.0044,P=0.0830q 完全随机化设计资料的非参数检验 书例13-2 先将数据用文本文件npar2.txt存于D:sas3中,用infile语句调用。data npar2;infile d:
22、sas3npar2.txt;do i=1 to 10;do c=1 to 5;input x ;output;end;end;proc npar1way wilcoxon;class c;var x;run; N P A R 1 W A Y P R O C E D U R E Wilcoxon Scores (Rank Sums) for Variable X Classified by Variable C Sum of Expected Std Dev MeanC N Scores Under H0 Under H0 Score1 10 188.500000 255.0 41.229076
23、3 18.85000002 10 280.500000 255.0 41.2290763 28.05000003 10 420.000000 255.0 41.2290763 42.00000004 10 95.000000 255.0 41.2290763 9.50000005 10 291.000000 255.0 41.2290763 29.1000000 Average Scores Were Used for Ties Kruskal-Wallis Test (Chi-Square Approximation) CHISQ = 27.858 DF = 4 Prob CHISQ = 0.000156 结束语结束语